搜索资源列表
Text-Mining-in-R
- 主要介绍了R语言环境下的文本挖掘,包括自然语言处理技术综述、tm包、xml包及文本挖掘方面的应用。-Introduces the R language environment text mining, natural language processing techniques including application review, tm package, xml and text mining aspects of the package.
tm_0.5-10
- tm包是R语言中为文本挖掘提供综合性处理的package,进行操作前载入tm包,vignette命令可以让你得到相关的文档说明。 >vignette("tm") //会打开一个tm.pdf的英文文件,讲述tm package的使用及相关函数-R language tm package is to provide comprehensive treatment for text mining package, loaded tm package before the operation,
Tm_wordCloud
- R语言做文本挖掘的例子,附文本库和停用词,可直接运行; 另外代码中有词云展示功能!-R language to text mining example, with a stop word text libraries and can be run directly there is another code word cloud showing features!
data_mining
- 这是一个R的程序 文本挖掘的作业,用来统计新闻类别再进行分类 -This is an R program text mining operations for Statistical News category then classified
webmining-by-python
- 针对股吧的文本挖掘程序,进行股票发帖的文本分析。-webmining in guba by python
4bc0a929-5daa-43de-8775-839f38ad1493
- 文本挖掘量化选股系统,通过新浪等门户网站抓取热门关键词,用于量化股票市场的情绪-Text mining quantitative stock
Enhancedtextmining
- 强化版本文本挖掘流程,包含分词,分类聚类,分词结果评估等-Enhanced version of the text mining process, including word segmentation, classification clustering, segmentation results uation, etc.
a-sens-similar-method
- 多种短文本处理与相似度分析短,应用于文本挖掘方法,安装包-Short text processing and similarity analysis is short, which is applied to text mining.
text-mining
- 文本挖掘,用词项-文档矩阵带入算法模拟出标签云和词条网络-text mining
wine
- wine数据集,用于聚类分析,关联分析,文本挖掘-wine data set for cluster analysis, correlation analysis, text mining
ROST-CM6
- 本文档为对文本挖掘软件的较为详细的使用说明介绍,为使用者带来便利-This document is text mining software for more detailed instructions for use that, to bring convenience to users
Text-Mining-in-R
- 文本挖掘的经典实例,文本挖掘被描述为 “自动化或半自动化处理文本的过程”,包含了文档聚类、文档分类、自然语言处理、文体变化分析及网络挖掘等领域内容。-Text Mining in R
TMSVM
- TMSVM开源的文本挖掘代码,C++代码写的比较清楚,值得研究。-TMSVM opensource text mining code
tm
- 在文本挖掘领域中,**文本自动分类,判同,情感分析是文本挖掘比较常见的应用** 。***文本分类技术主要应用***在百度新闻,谷歌新闻等新闻网站,对新闻内容进行自动分类,并且实现根据用户专业倾向的文档推荐;搜索引擎去重,论文抄袭判别系统等。***情感分析技术主要应用***在电商评论分析系统,政府和媒体舆情监测系统等。***语意理解技术应用***在机器翻译、聊天机器人等。
cos
- 计算词向量间的余弦相似度,用于语义文本挖掘 。(Calculate the cosine similarity between word vectors for semantic text mining.)
769242
- 这是一个用于生成等值线的源代码,程序根据输入的高程文本文件,自动跟踪等值点,并生成相应的等值线,()
机器学习与数据挖掘方法和应用
- 本书分为5个部分,共18章,较为全面地介绍了机器学习的基本概念,并讨论了数据挖掘和知识发现中的有关问题及多策略学习方法,具体地阐述了机器学习与数据挖掘在工程设计,文本、图像和音乐,网页分析、计算机病毒和计算机控制,医疗诊断、生物医疗信号分析和水质分析中的生物信号处理等方面的应用情况。本书收集众多不同领域中数据挖掘的实际案例,以此来说明数据挖掘的具体解决方法,以期为广大读者提供一个更为广阔的数据挖掘(The book is divided into 5 parts, 18 chapters, a
CPSTB
- 文本文件读写及图形显示 1 自学随机数的生成,读取和曲线绘制的相关知识,用Rand函数实现随机数的获取, 2 实现将生成的()
textclustering-master
- 对于大文本进行挖掘聚类,该方法不考虑文字词语出现的频率信息,考虑上下文语境,将所有的字根据预定义的特征进行词位特征学习,获得一个训练模型。然后对待分字符串的每一个字进行词位标注,最后根据词位定义获得最终的分词结果。(Digging for large text clustering, the method does not consider the text word frequency of information, considering the context, all the words
initiabioation-recordset
- 这是一篇讲述聚类在文本挖掘中的应用的博士论文,个人认为讲述的还是比较细的()