搜索资源列表
一种中文文本聚类的研究.rar
- 这里设计了一个中文文本聚类模型CTCMCChinese'Pext Clustering Model),并针对模型中涉及到的特征表示、特征提取、特征向量调整和聚类算法等问题进行了研究。
聚类算法研究
- 聚类是数据挖掘中用来发现数据分布和隐含模式的一项重要技术。全面总结了数据挖掘中聚类算法的研究现状,分析比较了它们的性能差异和各自存在的优点及问题,并结合多媒体领域的应用需求指出了其今后的发展趋势。
LJClusterDemo
- 文本聚类是基于相似性算法的自动聚类技术,自动对大量无类别的文档进行归类,把内容相近的文档归为一类,并自动为该类生成特征主题词。适用于自动生成热点舆论专题、重大新闻事件追踪、情报的可视化分析等诸多应用。 灵玖Lingjoin(www.lingjoin.com)基于核心特征发现技术,突破了传统聚类方法空间消耗大,处理时间长的瓶颈;不仅聚类速度快,而且准确率高,内存消耗小,特别适合于超大规模的语料聚类和短文本的语料聚类。 灵玖文档聚类组件的主要特色在于: 1、速度快:可以处理海量规模
AIS
- 本文简要介绍了数据挖掘中的聚类、关联分析、时间序列分析等理论和技术,在分析目前交通领域的数据挖掘,特别是AIS信息的数据挖掘研究现状的基础上,针对网络化的AIS数据库的AIS信息特点,提出了用于AIS信息的挖掘方法-This paper briefly describes the data mining clustering, association analysis, time series analysis theory and technology, in analyzing the da
ARM
- 数据挖掘,分类的方法介绍和聚类的相关应用等-data mining
Clustering.Algorithms.Research
- 软件学报 2008年论文《聚类算法研究》,作者孙吉贵, 刘杰, 赵连宇。pdf格式,14页。对近年来聚类算法的研究现状与新进展进行归纳总结.一方面对近年来提出的较有代表性的聚类算法,从算法思想、关键技术和优缺点等方面进行分析概括 另一方面选择一些典型的聚类算法和一些知名的数据集,主要从正确率和运行效率两个方面进行模拟实验,并分别就同一种聚类算法、不同的数据集以及同一个数据集、不同的聚类算法的聚类情况进行对比分析.最后通过综合上述两方面信息给出聚类分析的研究热点、难点、不足和有待解决的一些问题.上
File3
- 数据挖掘,聚类,遗传算法,k-means算法,基于遗传算法的k-means聚类方法。-Data mining, clustering, genetic algorithm, k-means algorithm, based on genetic algorithm k-means clustering method.
File10
- Web文档聚类系统的设计与实现:数据挖掘;聚类分柝:文本挖掘;预处理;聚类组合;可 视化;欧氏距离-Web Document Clustering Design and Implementation: Data mining Clustering Hierarchical: text mining pretreatment cluster combinations visualization Euclidean distance
lunwen
- 可拓性数据挖掘 客户服务系统 系统聚类在客户关系管理中的应用-System gathers application in resembling in Customer Relationship Management
P
- 随着信息技术的发展,以电子形式存在的文本信息已经成为人们主要的信息来 源。人们迫切需要能够从Web上快速、有效地发现资源和知识的工具。近年来针 对文本数据的文本挖掘已逐渐成为人们研究的新课题。其中,对于文本聚类的研 究己经引起了广泛的重视,并取得了良好的成果。 本文首先对数据挖掘流程以及数据挖掘分类和各自的研究现状及发展进行了 概括的介绍;然后结合汉语自身的相关特点详细的分析了中文文本自动聚类中所 涉及到的关键问题及其技术;接着介绍了人工神经网络技术的发展的现状和特点
a_framework_
- 数据挖掘和数据处理的注意点和方法,专业术语熵,聚类等的算法说明-Algorithm descr iption of the data mining and data processing attention points and methods, terminology, entropy, clustering, etc.
8
- 基于模型的时间序列数据挖掘---聚类和预测相关问题研究 ---- Clustering and forecasting issues related to model-based time-series data mining
datamining
- 主要介绍在大型数据库中发现知识(Knowledge Discovery in Large Databases, KDD)的各种技术,是专门针对决策支持中的各类问题进行讨论的高端课程。面向对象为软件工程专业硕士研究生。 本课程讲授的主要内容包括:数据预处理、数据仓库及OLAP、概念描述型数据挖掘、关联规则挖掘、分类挖掘和预测以及聚类挖掘,涉及的领域包括数理统计、概率论、机器学习、信息论、集合论等等。-Introduces knowledge discovery in large dat
kmeans_report
- 数据挖掘kmeans图像聚类实验报告 用 VC 或 Java 实现 k-means 聚类算法, 分别以迭代次数及分配不再发生变化为算法终止条件,用图片(自己选择)作为数据集,比较运行时间(画出时间与像素点的关系曲线图,因此须用多幅像素个数不同的图片进行实验) 提交实验报告与源代码。 -Data mining to achieve the k-means clustering algorithm the kmeans image clustering experiment report wit
A-Possibilistic-Fuzzy-c-Means
- 数据挖掘的英文文章,对模糊C聚类方法进行了介绍,可以有效的理解外国数据挖掘的趋势。-The English articles of data mining, abroad and the development trend of data mining
FCM
- 模糊聚类算法源码,通过迭代聚类中心,以及隶属度函数,完成代码运算,用于数据挖掘初学者使用。(Fuzzy clustering algorithm source code, through the iterative clustering centers and membership function, complete code for data mining operations, for beginners to use.)
数据挖掘应用实例-银行客户数据分析
- 银行数据分析,详细说明了运用聚类分析的方法对银行数据进行分析的步骤(analysis of the bank data)
Introduction.To.Data.Mining].Pang
- 数据挖掘介绍,包括数据预处理,可视化,预测建模,关联分析,聚类和异常检测(Data mining introduces data preprocessing, visualization, predictive modeling, association analysis, clustering, and anomaly detection)
文本分析聚类实战
- 文本挖掘是从大量的文本数据中抽取隐含的,求和的,可能有用的信息。 通过文本挖掘实现 ?Associate:关联分析,根据同时出现的频率找出关联规则 ?Cluster:将相似的文档(词条)进行聚类 ?Categorize:将文本划分到预先定义的类别里(Text mining is a kind of information that is extracted from a large number of text data, which may be useful. Implementa
Clementine两步聚类
- 数据挖掘工具Clementine进行两步聚类的全流程指导