搜索资源列表
gmeans
- gmeans-- Clustering with first variation and splitting 文本聚类算法Gmeans ,使用了3种相似度函数,cosine,euclidean ,KL.文本数据使用的是稀疏矩阵形式. -gmeans clustering with first variation and splitting Gmeans,a text clustering algorithm, uses 3 functions,cosine,euclidean and
KMEANS聚类
- knn分类模式识别可用于文本挖掘和其他的识别分类,vc代码,-Commission pattern recognition can be used for classification of text mining and other identification classification, vc code,
Incremental_Document_Clustering
- 一个增量文本聚类的算法。 参考文献: Wai-chiu Wong, Ada Wai-chee Fu, Incremental Document Clustering for Web Page Classification. -an incremental version of the clustering algorithm. References : Wai-chiu Wong, Ada Wai-CHEE Fu, Incremental Document Clustering for
neucsp
- 很好的分词工具,能对文本进行分词,标注词性,是进行文本聚类不可或缺的工具
dsa
- 基于SOM算法实现的文本聚类,有详细的剖析与例证,希望大家喜欢
wawatextcluster
- 蛙蛙的中文文本聚类,主要采用k-means算法。wawa s text cluster using C#.
tct-070227
- 类似于Weka的文本聚类工具箱,可以读取Weka格式的文件,并实现了常用的文本聚类算法以及聚类集成算法,对于机器学习的朋友来说是个好东西
featureselectionbasedongeneticalgorithm
- 利用遗传算法进行文本聚类的特征选择.把一种特征组合看作一个染色体,对其进行二进制编码,引入文本集密度作为适应度函数进行特征个体适应度的评价.
DATA
- 文本聚类分类数据集 包括20newsgroup 和retuers 中抽取的500条数据,有四个表-Text clustering and classification of data sets including 20newsgroup retuers 500 extracted data, there are four tables
0010
- 基于WEKA平台的文本聚类及实现,以及常用的文本聚类效果评价指标-Text clustering based on WEKA platform and implementation, as well as common text clustering validity
K
- K均值算法-分类器-有效抑制边缘点影响-简单有效-K-means algorithm- Classifier- effectively inhibiting the impact of edge points- simple and effective
kMeans
- k-mean image clustering source code developed using java
K-Means
- K_Means(java)算法的实现,有界面,灵活性强,交互性强。-K_Means (java) algorithm, there are interfaces, flexibility, and strong interaction.
reuters21578
- 这是一个英文的语料库,可以用于进行文本的分类与聚类。是文本分类领域共用的一个语料库。-This is a corpus of English, can be used for text classification and clustering. The field of text classification is a common corpus.
CheckText
- 实现文本相似度检查的文本层次聚类算法和划分算法的C#源码-Text to check the text similarity hierarchical clustering algorithm and classification algorithm C# source code
order
- 文本聚类算法的好东西文 本聚类算法的好东西-Text clustering algorithm for text clustering algorithm good stuff good stuff good stuff text clustering algorithm
dbscan的matlab代码实现
- 使用MATLAB对文档进行聚类,尤其在数据挖掘中使用,一般用于文本特征表示之后(Clustering documents using MATLAB)
finallyliuyuClassifier
- 用于文本分类,文本挖掘,文本特征提取,文本聚类,文本关联等(It is used for text classification, text mining, text feature extraction, text clustering, text association, etc.)
chinese_text_cluster-master
- 基于中文文本的机器学习聚类算法的实现,包括LDA算法等(Chinese Text Clustering)
Python中文文本预处理
- 包括删除标点、分词、删除停用词、计算相似度、文本聚类等功能