搜索资源列表
一种实用高效的文本分类算法
- 一种实用高效的文本分类算法-a practical and efficient algorithm for text classification
支持向量机java实现
- 文本自动分类的java实现
textcluster
- 文本聚类算法源码,包含tf.idf计算的实现,采用java语言编写-text cluster algorithm, including the computation of tf.idf ,written by Java
Ncut
- 本文介绍了web文本聚类的流程,着重介绍了Normalized Cut谱聚类的原理和算法,提出以Minimum cut作为类内部的内聚强度作为衡量Normalized Cut的迭代停止条件
textsearch
- 一个超快的文本搜索算法 searchi = search ignore case search = search case sensitive searchiw = search ignore case words only (e.g. words delimited by whitespace only, not words within words) searchw() = search case sensitive words only -Super
bb
- 中文文本分类相关算法的研究与实现,介绍文本分类方法-Chinese text classification research and implementation of related algorithms, text classification introduced
ProgrammingPCollectivePIntelligence
- 本书以机器学习与计算统计为主题背景,专门讲述如何挖掘和分析Web上的数据和资源,如何分析用户体验、市场营销、个人品味等诸多信息,并得出有用的结论,通过复杂的算法来从Web网站获取、收集并分析用户的数据和反馈信息,以便创造新的用户价值和商业价值。全书内容翔实,包括协作过滤技术(实现关联产品推荐功能)、集群数据分析(在大规模数据集中发掘相似的数据子集)、搜索引擎核心技术(爬虫、索引、查询引擎、PageRank算法等)、搜索海量信息并进行分析统计得出结论的优化算法、贝叶斯过滤技术(垃圾邮件过滤、文本过