搜索资源列表
LJParser
- 聚类算法相关知识,有语料和训练文本集,可供大家学习。-AppWizard has created this application for you. This application not only demonstrates the basics of using the Microsoft Foundation classes but is also a starting point for writing your application.
myfirst1
- 实现吉布斯采样,可用来处理文本,对文本聚类,分析文本主题,请用vs2010打开-Achieve Gibbs sampling, can be used to handle text, text clustering, analysis of text themes
dsfds
- 语义高质量中文短信文本聚类算法Semantic quality of Chinese SMS text clustering algorithm-Semantic quality of Chinese SMS text clustering algorithm
1
- 基于WEKA平台的文本聚类研究与实现 文本聚类是文本挖掘领域的一个重要研究分支,是聚类方法在文本处理领域的应用。本文对基于空间向量模型的文本聚类过程做了较深入的讨论和总结,利用文本语料库,基于数据挖掘工具研究并实现了文本聚类的过程。本文首先给出了文本聚类的思想和过程,回顾了文本聚类领域的已有成果,列举了文本聚类领域在特征表示、特征提取等方面的基础研究工作。另外,本文回顾了现有的文本聚类算法,以及常用的文本聚类效果评价指标。在研究了已有成果的基础上,本文利用20 Newsgroup文本语料库,
textcluster
- 文本聚类 预处理+KMeans的Java程序-Clustering preprocessing+ KMeans the Java program
InformationRetrieval
- 关于信息检索技术的说明和文本聚类简介,介绍了几种主要文本聚类算法-Introduction to Information Retrieval and Text Clustering
e4k-means-althogrim
- 基于K—Means的中文文本聚类算法的研究和实现。中文文本聚类的主要技术,特征选择,共享最近邻的K-Means的改进算法。基于k-Means的实现和实验。-Based on the Chinese version of K-Means clustering algorithm and implementation. The main technology of Chinese Text Clustering, feature selection, shared nearest neighbor
vsm-and-cluster-kmeans
- 对文本聚类的向量空间模型机制VSM以及Kmeans等讲解比较详细,是研究文本聚类的好书籍-Clustering of text vector space model to explain the mechanism of VSM and Kmeans and other more detailed, study of text clustering is a good book
P
- 随着信息技术的发展,以电子形式存在的文本信息已经成为人们主要的信息来 源。人们迫切需要能够从Web上快速、有效地发现资源和知识的工具。近年来针 对文本数据的文本挖掘已逐渐成为人们研究的新课题。其中,对于文本聚类的研 究己经引起了广泛的重视,并取得了良好的成果。 本文首先对数据挖掘流程以及数据挖掘分类和各自的研究现状及发展进行了 概括的介绍;然后结合汉语自身的相关特点详细的分析了中文文本自动聚类中所 涉及到的关键问题及其技术;接着介绍了人工神经网络技术的发展的现状和特点
wenbenjulei
- 一种基于小生境的中文文本聚类新方法-Niche based on the Chinese text of the new method of clustering
MessageClustering
- 用java实现的应用了weka包的Kmeans方法的文本聚类程序。-a program written in java with simplekmeans in weka.jar.
K-Means_Text_Cluster
- K-Means文本聚类python实现,文本聚类算法,人名排除歧义-Text Cluster by the algorithm of K-means(include texts), discrimination of name ambiguity.
234
- :词汇语义分类存文本聚类、信息检索、机器翻译等多个研究领域l11拥有重要的理论及实践意义-: Lexical semantics, save text clustering, information retrieval, machine translation and other research areas have important theoretical and practical significance
TextClustering
- 文本聚类算法包含 tfidf的实现 k-means算法的实现-Text clustering algorithm contains tfidf implementation of the k-means algorithm to achieve
ClusteringAnalysis
- java实现的K-Means文本聚类文章,采用英文撰写,需要源码的可以发邮件lixinle@yahoo.cn。-java realize the K-Means Text Clustering articles written in English to the source code can email lixinle@yahoo.cn.
AdvanceEditDistance
- 编辑距离算法的详尽实现,是文本聚类的很好解决途径,解决了经典编辑距离的弊端,在vc6.0下实现,能处理大规模文本,速度快,效率高。-Edit distance algorithm detailed implementation is a good text clustering solutions to address the shortcomings of the classical edit distance, in vc6.0 to achieve, can handle large-sc
optics_cos
- 基于余弦聚类的OPTICS聚类算法,能够用于文本聚类-This is the OPTICS clustering algorithm based on cosine distance which can be used in text clustering.
1
- 主要针对行业应用中用户信息、文本聚类等方面的K-means算法应用,覆盖面广-Mainly for industrial applications, user information, text clustering, K-means algorithm is applied, the coverage of a wide range of
VSM
- vsm矩阵构建以及同现矩阵概率计算,用于文本聚类等-The vsm matrix construction, and calculate the same probability of occurrence matrix for document clustering
text-clustering
- 文本聚类及主题挖掘相关论文合集,包括了kmeans,层次聚类,ap聚类等等相关方法-Text clustering and topic mining related collection of papers