搜索资源列表
LHY
- 文本统计与识别的代码 用到了聚类的算法 是统计课程的大作业
FCM的一种实现方法
- 请运行程序,并在程序所在文件夹下面创建文本文件:datain.txt和paramOut.txt,文件的详细说明见下面。程序的运行没有可视的界面,运行完毕之后会在该文件夹下面产生center.txt和matrix.txt两个文件,其中center.txt为聚类的中心,matrix.txt为隶属度矩阵。在运行本程序之前,先参考一下FCM聚类算法介绍.doc
vsm
- 向量空间模型生成算法 文本挖掘的关键步骤就是对所给文档生成向量空间模型,然后对进行段落聚类-vsm generation algorithm text mining is a key step to the right documents generated by the vector space model, then right for paragraphs Clustering
kMeans
- k-mean image clustering source code developed using java
program
- 基于无监督学习的谱聚类算法的文本的聚类分类。-Unsupervised Learning Based on spectral clustering algorithm for text clustering classification.
ClusterTitle_ED
- 能实现大规模文本间的编辑距离的计算,算法完整市现了处理过程,基于vc6.0环境编写,可以运用与聚类算法。-To achieve large-scale text edit distance between the calculation, the algorithm is a complete city process, based on the vc6.0 environmental preparation, and clustering algorithms can be used.
IntServer
- 复杂网络聚类算法进行文本分析,能够进行关键字的提取和分类功能。-Complex network clustering algorithm for text analysis, to carry out keyword extraction and classification capabilities.
improved-MSER-algorithm-
- 本文在比较多种仿射不变性区域的基础上,选取最大稳定极值区域(MSER)对图像内容进行分割和提取,并通过构造仿射不变量的方法,对提取出来的区域进行规整化,进而从规整化的区域中提取SIFT描述子,然后根据匹配目标的需要进行特征的组合、变换,以形成易于匹配、稳定性好的特征向量,从而把图像匹配问题转化为特征的匹配问题 通过改进的K均值算法对特征向量进行聚类,聚类中心作为图像的视觉关键词:利用视觉关键词的思想,把文本检索技术领域的方法移植到图像检索应用上;并研究视觉关键词之间的空间约束关系。-Most r
SC_demo
- 整理图像特征点提取和分类的程序(可以作为场景分类的前期工作),自己调试过能运行,特征点提取用的SIFT算法,使用K-means聚类算法,将得到的20个聚类中心写入txt文本中-Finishing the image feature point extraction and classification procedures (which can be as the preparatory work of the scene classification), their own debugging
AdvanceEditDistance
- 编辑距离算法的详尽实现,是文本聚类的很好解决途径,解决了经典编辑距离的弊端,在vc6.0下实现,能处理大规模文本,速度快,效率高。-Edit distance algorithm detailed implementation is a good text clustering solutions to address the shortcomings of the classical edit distance, in vc6.0 to achieve, can handle large-sc
optics_cos
- 基于余弦聚类的OPTICS聚类算法,能够用于文本聚类-This is the OPTICS clustering algorithm based on cosine distance which can be used in text clustering.
1
- 主要针对行业应用中用户信息、文本聚类等方面的K-means算法应用,覆盖面广-Mainly for industrial applications, user information, text clustering, K-means algorithm is applied, the coverage of a wide range of
Cjulei
- 将文本文件中数据按照C均值聚类算法进行聚类-The text file data according to C-means clustering algorithm for clustering
AP-Cluster
- AP聚类算法的C++代码实现,其中数据是文本读入iris数据,P值选取欧式矩阵最小值。显示结果为聚类后结果-AP clustering algorithm C++ code, in which data is read into the text iris data, P values selected European matrix minimum. Showing results clustering results after
DataSets
- 文本聚类用到的数据集,国外人提供的用于聚类算法-dataset,EMforSoftKmeans dataset Binary_1 Binary_2
malletTest
- mallet测试代码, 非常优秀的自然语言处理工具包,基于Java编写,可以进行文本分类,聚类等功能,并且支持加入自定义的算法,其中有众多的API接口,有着很好的研究和实用价值。-mallet test code, very good natural language processing toolkit based on Java, you can text classification, clustering and other functions, and supports adding
cluster
- python语言实现k-means算法和Fast Search And Find Of Density Peaks算法用于文本聚类,-python language implements k-means algorithm and Fast Search And Find Of Density Peaks for text clustering algorithm,
maxent-master
- 最大熵模型算法,用于统计学习,文本分类,文本聚类研究-The maximum entropy model algorithm for statistical learning, text classification, text clustering research
kmeans
- k-means算法是文本聚类经典算法,也是数据挖掘十大经典算法之一。k-means算法Java实现。-k-means algorithm is a classical algorithm text clustering, data mining is one of the ten classic algorithms. k-means algorithm is implemented in Java.
cluster
- mahout的聚类算法,采用了路透社的预料文本,出自《mahout in action》一书。-Mahout clustering algorithm