搜索资源列表
LJClusterDemo
- 文本聚类是基于相似性算法的自动聚类技术,自动对大量无类别的文档进行归类,把内容相近的文档归为一类,并自动为该类生成特征主题词。适用于自动生成热点舆论专题、重大新闻事件追踪、情报的可视化分析等诸多应用。 灵玖Lingjoin(www.lingjoin.com)基于核心特征发现技术,突破了传统聚类方法空间消耗大,处理时间长的瓶颈;不仅聚类速度快,而且准确率高,内存消耗小,特别适合于超大规模的语料聚类和短文本的语料聚类。 灵玖文档聚类组件的主要特色在于: 1、速度快:可以处理海量规模
FindString
- 在一个目录中的多个文本文件中搜索指定字符串的出现,将搜索到的结果输出到一文本文件中,其中包括该字符串出现的文件、在其中的行数、该行的全部或部分内容。-In a directory specified number of text files in the search string appear to the search results output to a text file, including documents of the string appears, in which the