搜索资源列表
webclass
- 中文文本分类算法文档 属于论文CAJ格式的-Chinese text classification algorithm paper documents belonging to the CAJ format
ANewmethod
- 一种文本分类数据挖掘的技术,比较几种不同的文本分类方法,重点介绍熵。
knn
- 朴素贝叶斯(Naive Bayes, NB)算法是机器学习领域中常用的一种基于概率的分类算法,非常简单有效。k近邻法(k-Nearest Neighbor, kNN)[30,31]又称为基于实例(Example-based, Instance-bases)的算法,其基本思想相当直观:Rocchio法来源于信息检索系统,后来最早由Hull在1994年应用于分类[74],从那以后,Rocchio方法就在文本分类中广泛应用起来。
yulao.SogouT.min
- soguo公司的语料,用于文本,网页分类,很好的语料库。
KNN
- 一个介绍KNN文本分类技术的不错的文章,大家都来看看啊-An introductory text classification technology KNN good article, everyone来看看啊
fileSorterFilter
- 可以实现邮件过滤功能,邮件分类的应用程序。基于文本分类的邮件过滤器,很实用!-Can e-mail filtering, mail classification applications. Text classification based on the spam filter, it is practical!
11
- 提供学生信息的录入功能,实现将学生的信息保存在文本文件中; 提供学生信息的删除功能,实现将不需要的学生信息在文本文件中除去; 提供学生信息的修改功能,实现改正学生的信息并保存在文本文件中; 提供学生信息的查询功能,实现在文本文件中查找到学生的信息; 提供学生的分类功能;能将不同专业的学生分类管理; 提供学生信息统计功能,统计不同分类学生的分部情况; 提供导入、导出excel文件功能,实现文本文件与excel的互操作; 系统支持全键盘功能;-Provide studen
Thresholding
- 本文主要针对中文网页,分析比较了文本分类中的关于类别阈值的几种策略,分别是: 位置截尾法(RCut)、比例截尾法(PCut)、最优截尾法(SCut)以及改进型截尾(RTCut)-This paper reports a study with several thresholding strategies for Chinesetext categoryization,including rank-based thresholdi (Rcut),proportion-based assignmen
RoughSetAndSVM
- 本文提出一种综合粗糙集与支持向量机的 Web 文本分类模型,利用粗糙集的属性约简方法,减少支持向量机训练数据的维数,提高 Web 文本分类的性能与效率.-This article advances a Web text classification model which synthesis rough set and support vector machine. Using the rough set’s attribute reduction method to reduce the di
Text-feature-dimension-reduction
- 关键词:文本分类 特征降维 规则抽取 模式聚合 粗糙集 -Keywords: text classification feature dimension reduction rule extraction model aggregation rough set
KNN
- 文本分类的论文,在知网上下载的,现在共享,需要的可以下载,因为有的人在知网上下不了东西-Text Classification papers, in known online download, now share the need can be downloaded, not something some people up and down in the HowNet
bijishibie
- 基于纹理分析笔迹鉴别系统的设计与实现,文中从笔迹图像预处理、特征提取、分类器以及分类器组合等方而展开研究,设计和实现了一个基于文本独立的离线手写体笔迹鉴别系统软件.-Design and Implementation of the writer identification system based on texture analysis, the paper from the handwriting image preprocessing, feature extraction, classi
fisher-de-matlab
- 文本挡的firsher线性判别器是最简单的模式识别分类,在这里用了matlab进行了编程-Text the gear firsher linear discriminant is the most simple pattern recognition classification, where the Matlab programming
rfa
- 基于随机森林的文本分类模型,其中介绍了如何使用随机森林进行文本分类的思想-Text classification based on random forest model, which describes how to use the idea of the random forest for text classification
frequent-term-based-text-clustering
- 一篇很好的基于主题的聚类方法论文,可以用在文本分类等众多领域-frequent term-based text clustering
IG
- 文本分类中特征提取的代码。采用信息增益法,对文本的空间向量模型能达到有效降维。文件的输入形式必须是词号-词频形式。- Text Categorization feature extraction code. Using information gain method, the vector space model of the text to achieve effective dimensionality reduction. Enter the file must be in the f
PMl-IR
- Blog信息源和信息量的广泛增长给中文文本分类带来了新的挑战。本文提出了—种基于PMI—IR算法的四种情感分类方法来对Blog文本进行情感分类。该方法以情感词语为中心,通过搜索引擎返回的结果来计算文本 中的情感要素和背景情感词之问的点互信息值,从而对文本进行情感分类。该方法在国家语言资源监测与研究中心网络媒体语言分中-心2008年度的Blog语料和COAE2008的语料上分别进行了测试。与传统方法相比准确率和召回率都有了较大的提高。-Development ofBIog texts info
Text-Categorization
- 基于新的关键词提取方法的快速文本分类系统 理论研究-Text Categorization
base-on-WEKA-text-cluster-apllying
- weka平台的文本分类测试,源代码为java-Text categorization test weka platform, the source code for the java
