搜索资源列表
lindatanetwork1.rar
- 主要是数据挖掘中的文本挖掘算法及其分析,其中包括层次聚类,空间向量模型等,处理对象有对于网页的也有针对纯文本的。,Mainly in data mining and analysis of text mining algorithms, including hierarchical clustering, vector space model to deal with subjects of the pages are for plain text.
LJClusterDemo
- 文本聚类是基于相似性算法的自动聚类技术,自动对大量无类别的文档进行归类,把内容相近的文档归为一类,并自动为该类生成特征主题词。适用于自动生成热点舆论专题、重大新闻事件追踪、情报的可视化分析等诸多应用。 灵玖Lingjoin(www.lingjoin.com)基于核心特征发现技术,突破了传统聚类方法空间消耗大,处理时间长的瓶颈;不仅聚类速度快,而且准确率高,内存消耗小,特别适合于超大规模的语料聚类和短文本的语料聚类。 灵玖文档聚类组件的主要特色在于: 1、速度快:可以处理海量规模
demo
- 实现数据挖掘的几个算法,包括模糊聚类,K均值,以及K近邻等聚类算法-Some of the implementation of data mining algorithms, including fuzzy clustering, K-means, as well as neighbors, such as clustering algorithm K
K-means_clustering_demo
- K-均值聚类算法 vc++图形演示程序-K-means clustering algorithm c++ demo program
PLSA
- PLSA 的Java实现,可以用于图像处理,文本分类,文本聚类等-code of PLSA in JAVA
textFCM
- 应用FCM(模糊c均值聚类)算法到文本聚类 采用两种方法计算文本相似度 采用ShootSeg分词 采用sogou互联网词库简化特征值计算-err
KClustering
- k-聚类算法-k- gathers a kind of algorithm
extract_document
- 这是一个提取 Reuter-21578 的程序, 用做自然语言处理, 文本分类聚类,和信息检索的测试集!-This is an extract of the Reuter-21578 procedure, used for natural language processing, text classification clustering, and information retrieval test collection!
Clustering
- 用于文本的聚类,里面包含两个java文件,需放在同一个包内-For text clustering, which contains two java files, need to be placed within the same package
KAV
- KAV是利用Visual C++ 6.0编写的一个小程序,能实现对特定数据结果的文本数据进行聚类分析,所使用的聚类方法是K均值。 -KAV is the use of Visual C++ 6.0 to prepare a small procedure to achieve the outcome of specific data on the text data clustering analysis, the use of the K-means clustering method.
kmeans
- java k均值源码,实现了k-means的算法,并给出界面显示。实例中通过二维空间中的点进行聚类。-java k-means algorithm, display the cluster result on the two demension.
Ncut
- 本文介绍了web文本聚类的流程,着重介绍了Normalized Cut谱聚类的原理和算法,提出以Minimum cut作为类内部的内聚强度作为衡量Normalized Cut的迭代停止条件
k-means_Program
- k-means 算法接受输入量 k ;然后将n个数据对象划分为 k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。聚类相似度是利用各聚类中对象的均值所获得一个“中心对象”(引力中心)来进行计算的。 -k-means algorithm to accept input k then n-k of data objects into a cluster in order to make the cluster available to meet: t
111
- 有关层次聚类的源码,对于文本聚类有一定作用。-Hierarchical clustering,Text Clustering
TextClusteringKmeans
- 从文本文件读入文本,分词,去停顿词,然后利用kmeans进行文本聚类-Text Clustering with K means
Kmeans
- K-means算法实现文本聚类,Java实现的版本-K-means algorithm for text clustering
FCM
- 基于遗传FCM算法的文本聚类,FCM算法运用到文本中-Based on genetic FCM clustering algorithm, FCM algorithm is applied to the text
DBSCAN Clustering
- 基于matlab的dbscancluster的实现可用于文本聚类(The implementation of dbscancluster based on Matlab can be used for text clustering)
文本分析聚类实战
- 文本挖掘是从大量的文本数据中抽取隐含的,求和的,可能有用的信息。 通过文本挖掘实现 ?Associate:关联分析,根据同时出现的频率找出关联规则 ?Cluster:将相似的文档(词条)进行聚类 ?Categorize:将文本划分到预先定义的类别里(Text mining is a kind of information that is extracted from a large number of text data, which may be useful. Implementa
textclustering-master
- 对于大文本进行挖掘聚类,该方法不考虑文字词语出现的频率信息,考虑上下文语境,将所有的字根据预定义的特征进行词位特征学习,获得一个训练模型。然后对待分字符串的每一个字进行词位标注,最后根据词位定义获得最终的分词结果。(Digging for large text clustering, the method does not consider the text word frequency of information, considering the context, all the words