搜索资源列表
Mutis1.4-Beta1
- Mutis是Lucene搜索引擎的德尔福端口。索引,目录和出色的性能与基于文本的搜索信息提供了一个灵活的API。实现自定义搜索引擎,研究,全文检索,数据挖掘和更优良。-Mutis is a Delphi port of the Lucene Search Engine. Provide a flexible API for index, catalog and search text-based information with great performance. Excelent for i
WordNet
- 用于数据挖掘方面的。潜在语义索引最初是一种知识的自动提取和表示的方法,近年来广泛地应用到文本检索中-For data mining. Latent Semantic Indexing is a knowledge of the first automatic extraction and representation methods in recent years, widely used in text retrieval
Web-text-mining-in
- 基于Web中文本信息采集的研究与分析,Web 挖掘是一项综合技术,涉及Web、数据挖掘、计算语言学、信息学等多个领域-Web-based Chinese information collected in this research and analysis, Web mining is an integrated technology, involving Web, data mining, computational linguistics, information science and
p5
- 中文文本数据挖掘研究,写的非常详细.rar-Chinese text data mining research, write a very detailed
The-progress-of-text-mining-research
- 挖掘又称为文本数据挖掘或文本知识发现,是指在大规模文本集合中发现隐含的、以前未知的、潜在有用的模式的过程.-Text mining,also known as text data mining or text knowledge discovery,means discovering implicit,previously unknown,and potentially useful patterns in large amounts of text.
ARFFInputformat
- hadoop下自定义的读文件格式类,对于数据挖掘分类算法的训练测试文本的特殊格式有很大帮助.-hadoop read the file format class custom of great help for training in the special format of the test text data mining classification algorithms.
DataGen.tar
- 数据挖掘关联规则算法的数据生成器,参数在txt文本中,可以自己设置.-The data mining algorithm of association rule data generator parameters txt text, you can set up their own.
master_thesis
- 音乐领域中文实体关系抽取研究 实体关系抽取的任务是从文本中抽取出两个或者多个实体之间预先定义 好的语义关系。本文将实体关系抽取定义为一个分类问题,主要研究内容是 中文音乐领域的实体关系抽取。针对这一问题,本文首先构建了中文音乐实 体关系语料库,然后分别采用了基于序列模式挖掘的无指导的方法和基于特 征提取的有指导的方法来解决这一问题。 -Dissertation for the Master Degree in Engineering urgently needed to de
The-programming-collective-wisdom
- 《集体智慧编程》(programming collective intelligence building smart web 2.0 applications)以机器学习与计算统计为主题背景,专门讲述如何挖掘和分析web上的数据和资源,如何分析用户体验、市场营销、个人品味等诸多信息,并得出有用的结论,通过复杂的算法来从web网站获取、收集并分析用户的数据和反馈信息,以便创造新的用户价值和商业价值。全书内容翔实,包括协作过滤技术(实现关联产品推荐功能)、集群数据分析(在大规模数据集中发掘相似的数
ISliiqzipm
- 实现数据挖掘的一个重要算法sliq。能够从文文本中读出数据,并进行数据挖掘的关联规则分析。 -An important data mining algorithms sliq. Able to read data from the texts, and data mining association rules.
2012.10.16
- 微博的工作日志写的关于《基于MB-LDA》模型的微博主题挖掘,了解了LDA是一种文本生产模型,采用概率产生式对文本进行建模,而微博生成模型MB-LDA是对于LDA的基础上增加了对微博的联系人关系和文本关联进行统一建模形成适合微博主题挖掘的模型-Microblogging log write on microblogging theme mining model based on the MB-LDA " to understand the LDA is a text production
util
- 很多文本处理有用的工具,NLP,数据挖掘都能用到-A lot of useful text processing tools, NLP, data mining can be used
SVM_windows
- 本源代码实现了windows下面的svm文本分类算法,对于研究数据挖掘的同学有一定的帮助。-The source code to achieve the windows below the SVM text classification algorithm for the study of data mining students have some help.
text-clustering
- 文本聚类及主题挖掘相关论文合集,包括了kmeans,层次聚类,ap聚类等等相关方法-Text clustering and topic mining related collection of papers
data-minin-for-text-classification
- 在数据挖掘中,比较典型的就是关于文本的分类,此文档介绍关于文本的分类方法-data minin for text classification
NaiveBayes
- 基于朴素贝叶斯算法实现的文本分类程序,对数据挖掘的初学者具有很好的学习参考价值。-Based on Bayesian text classification algorithm procedures, data mining beginners a good learning reference value.
pymining_0_1
- python 文本分类挖掘软件,内含python源码-python code for text mining
java_stopword_code
- Java 数据挖掘进行文本预处理的一步,除去文本中包含的停用词-Java Data Mining for text preprocessing step to remove the text contains the word disabled
SogouC.reduced.20061102.tar
- 搜狗语料库,用于文本分类 数据挖掘 机器学习里面非常有用-Sogou corpus for text classification data mining machine learning which is very useful
kmeans
- 使用数据挖掘中的k-means算法实现文本的分类-Using data mining k-means algorithm text classification