搜索资源列表
TextAbstractor3
- 能够对文本的内容进行显示功能,并且能够根据客户的需求可以对关键字查找,并显示带有关键字的句子,并且采用句子分割技术进行处理,实现断句功能。即可以把该文章带有此关键字的句子分句显示出来,该软件的使用必须在ODBC中进行相关的设置,详细请看我的说明文档,请大家导入文章时选择txt的文件格式。我目前正在开发更好的文本挖掘工具,如果大家有什么好的建议和想法请发EMAIL给我:andondon-right to the contents of the text for display, and accor
datamining03
- 文本挖掘的起源 文本挖掘的过程 特征建立 特征集缩减 知识模式提取 模型评价 国内外研究状况 -Text Mining Text Mining the origin of the process of establishing reduced feature set of knowledge extraction model to evaluate the model at home and abroad Research
wenbenwajue1232
- 关于文本挖掘的摘要,对各种聚类算法进行了分析,是个好的东西-on Text Mining summary of the various clustering algorithms to the analysis is a good thing
2007Z
- 语义平滑文件模式聚类,代表了文本挖掘的前沿技术,和热门方向(英语原版)-semantic document clustering model, the representative of the Text Mining of advanced technology, and popular direction (English original)
SurveyTextMining
- 这是一本关于文本挖掘的书籍,包括聚类 分类 信息提取的内容
TextMining01-intro
- 文本挖掘概述,ppt格式。入门者值得一看
tm_0.3
- R-Project是一个开源的统计软件,专门有一个R语言,类似S语言,这个包里面就是一个R实现的文本挖掘(text mining简称tm)的包.里面有代码和样本数据.
the_application_of_clustering
- 这是一篇讲述聚类在文本挖掘中的应用的博士论文,个人认为讲述的还是比较细的.
webwining
- 这是北京大学文本挖掘的讲义,研究文本挖掘的可以下载,很不错
webwenbenwajue
- 硕士论文:文本挖掘在Web日志数据预处理中的应用研究
prop200406
- 概率句法分析器对于统计自然语言处理的很多高层应用,如统计机器翻译、问答系统、信息抽取、文本挖掘等都是至关重要的,直接决定这些应用系统的最终性能。本系统是一个概率型的Chart分析器。系统的分析算法是采用了多种优化策略。分析结果是概率最大的一棵分析树。在概率模型方面,本系统在一定程度上突破了pcfg的上下文无关假设,引入了结构上下文条件,使得分析结果正确率有了明显提高。在使用宾州中文树库进行的实验中,我们的分析器的标记召回率和标记精确率平均在75%-80%左右。在使用一个短句树库进行的实验中,两个
vsm
- 向量空间模型生成算法 文本挖掘的关键步骤就是对所给文档生成向量空间模型,然后对进行段落聚类-vsm generation algorithm text mining is a key step to the right documents generated by the vector space model, then right for paragraphs Clustering
LSA.zip
- LSA中包含几篇有关文本挖掘的资料,介绍了lsi和svd算法,LSA contains several text mining of the information presented and svd algorithm lsi
demo
- 实现数据挖掘的几个算法,包括模糊聚类,K均值,以及K近邻等聚类算法-Some of the implementation of data mining algorithms, including fuzzy clustering, K-means, as well as neighbors, such as clustering algorithm K
lingpipe-3.6.0
- 一个自然语言处理的Java开源工具包。LingPipe目前已有很丰富的功能,包括主题分类(Top Classification)、命名实体识别(Named Entity Recognition)、词性标注(Part-of Speech Tagging)、句题检测(Sentence Detection)、查询拼写检查(Query Spell Checking)、兴趣短语检测(Interseting Phrase Detection)、聚类(Clustering)、字符语言建模(Character
自组织神经网络在文本分类中的应用研究
- 针对信息挖掘中的文本自动分类问题 提出了一种基于自组织特征映射网络的分类方法 网络由输入层和 竞争层组成 输入层节点与竞争层节点实行全互连接 输入层完成分类样本的输入 竞争层提取输入样本所隐含的 模式特征 并对其进行自组织 在竞争层将分类结果表现出来 分无监督和有监督两个阶段完成对网络的分类训练 该方法在特征提取时充分考虑了特征项在文档中的位置信息 构造出模糊特征向量 使自动分类原则更接近手工分 类方法 以中国期刊网全文数据库部分文档数据为例验证了该方法的有效性
text-data-mining
- 此程序实现了如何在TXT或WORD文档中进行数据挖掘,在文本中提取有用信息-The realization of this procedure how to TXT or WORD document to carry out data mining, in the text to extract useful information
ddsvm
- SVM算法dd,来自国外做数据挖掘和文本分类的-SVM algorithm dd, from abroad to do data mining and text classification
KMEANS
- knn分类模式识别可用于文本挖掘和其他的识别分类,vc代码,-Commission pattern recognition can be used for classification of text mining and other identification classification, vc code-knn classification text mining and pattern recognition can be used to identify the other cate
text_data_mining
- java编写的数据挖掘方面的代码,里面包含有文本分类,作者身份识别方面的java源码,本人亲自参与编写-java code about data mining;include:text cluster ,authorship identification,