搜索资源列表
datamining03
- 文本挖掘的起源 文本挖掘的过程 特征建立 特征集缩减 知识模式提取 模型评价 国内外研究状况 -Text Mining Text Mining the origin of the process of establishing reduced feature set of knowledge extraction model to evaluate the model at home and abroad Research
2007Z
- 语义平滑文件模式聚类,代表了文本挖掘的前沿技术,和热门方向(英语原版)-semantic document clustering model, the representative of the Text Mining of advanced technology, and popular direction (English original)
TextMining01-intro
- 文本挖掘概述,ppt格式。入门者值得一看
一种中文文本聚类的研究.rar
- 这里设计了一个中文文本聚类模型CTCMCChinese'Pext Clustering Model),并针对模型中涉及到的特征表示、特征提取、特征向量调整和聚类算法等问题进行了研究。
LJClusterDemo
- 文本聚类是基于相似性算法的自动聚类技术,自动对大量无类别的文档进行归类,把内容相近的文档归为一类,并自动为该类生成特征主题词。适用于自动生成热点舆论专题、重大新闻事件追踪、情报的可视化分析等诸多应用。 灵玖Lingjoin(www.lingjoin.com)基于核心特征发现技术,突破了传统聚类方法空间消耗大,处理时间长的瓶颈;不仅聚类速度快,而且准确率高,内存消耗小,特别适合于超大规模的语料聚类和短文本的语料聚类。 灵玖文档聚类组件的主要特色在于: 1、速度快:可以处理海量规模
自组织神经网络在文本分类中的应用研究
- 针对信息挖掘中的文本自动分类问题 提出了一种基于自组织特征映射网络的分类方法 网络由输入层和 竞争层组成 输入层节点与竞争层节点实行全互连接 输入层完成分类样本的输入 竞争层提取输入样本所隐含的 模式特征 并对其进行自组织 在竞争层将分类结果表现出来 分无监督和有监督两个阶段完成对网络的分类训练 该方法在特征提取时充分考虑了特征项在文档中的位置信息 构造出模糊特征向量 使自动分类原则更接近手工分 类方法 以中国期刊网全文数据库部分文档数据为例验证了该方法的有效性
webDiging
- web数据挖掘方面的几篇文章,基于Web的文本挖掘系统的研究与实现.pdf,基于WWW的文本信息挖掘.pdf-Seeding the survey and analysis of research literature with text mining.pdf
File10
- Web文档聚类系统的设计与实现:数据挖掘;聚类分柝:文本挖掘;预处理;聚类组合;可 视化;欧氏距离-Web Document Clustering Design and Implementation: Data mining Clustering Hierarchical: text mining pretreatment cluster combinations visualization Euclidean distance
Webwen
- Web文本挖掘技术 基于当前挖掘技术做出解释 为研究者提供重要信息-webwenbwn
221
- 实现中文文本挖掘中最长频繁序列的发现算法-text searching
web
- 基于文件指纹的Web文本挖掘的原理论述,非常详细-Fingerprint-based Web text mining document the principles of discourse, very detailed
P
- 随着信息技术的发展,以电子形式存在的文本信息已经成为人们主要的信息来 源。人们迫切需要能够从Web上快速、有效地发现资源和知识的工具。近年来针 对文本数据的文本挖掘已逐渐成为人们研究的新课题。其中,对于文本聚类的研 究己经引起了广泛的重视,并取得了良好的成果。 本文首先对数据挖掘流程以及数据挖掘分类和各自的研究现状及发展进行了 概括的介绍;然后结合汉语自身的相关特点详细的分析了中文文本自动聚类中所 涉及到的关键问题及其技术;接着介绍了人工神经网络技术的发展的现状和特点
TextFeatureSelectionAlgorithm
- 在文本挖掘中,文档通常以特征向量的形式表示。为了提高文本挖掘算法的运行速度,降低占用的内存空间,过滤掉不相关或相关程度低的特征,提出一种改进的特征选择算法,该算法对特征进行综合考虑,从而更加准确地选取有效的特征。实验验证了改进算法的可行性和有效性。-In text mining,documents are usually meanwith the form of the eigenvector.In order to enhance the operating speed and red
TextminingtechnologySummary
- 文本挖掘,是一个对具有丰富语义的文本进行分析从而理解其所包含的内容和意义的过 程 对其进行深入的研究势必将极大地提高人们从海量的文本数据中提取信息的能力,具有很高的商业价值。-Text mining, that have a rich semantic text analysis in order to understand the content and significance of the process it contains its in-depth study is bound
tm
- 这是R语言中的tm 包(文本挖掘包),文本挖掘是目前建模数据获取、处理的一个 比较强大环节-introduction to the tm package-txt mining in R
Internet
- 文本挖掘的INTERNET的应用,可用于研究。-INTERNET application of text mining can be used for research.
wekatext
- weka 文本挖掘-weka text mining
Text-Mining-in-R
- 主要介绍了R语言环境下的文本挖掘,包括自然语言处理技术综述、tm包、xml包及文本挖掘方面的应用。-Introduces the R language environment text mining, natural language processing techniques including application review, tm package, xml and text mining aspects of the package.
a-sens-similar-method
- 多种短文本处理与相似度分析短,应用于文本挖掘方法,安装包-Short text processing and similarity analysis is short, which is applied to text mining.
文本分析聚类实战
- 文本挖掘是从大量的文本数据中抽取隐含的,求和的,可能有用的信息。 通过文本挖掘实现 ?Associate:关联分析,根据同时出现的频率找出关联规则 ?Cluster:将相似的文档(词条)进行聚类 ?Categorize:将文本划分到预先定义的类别里(Text mining is a kind of information that is extracted from a large number of text data, which may be useful. Implementa