搜索资源列表
Lucene
- 在网上找到的一本全面介绍lucene分词功能书。很不错!-a book named lucene in action
zhishifencisuanfa
- 基于知识分词算法的病案全文检索系统, 硕士论文.-Knowledge-based segmentation algorithm cases full-text retrieval system, a master s thesis.
ZuiDaPiPeiSuanFa
- 对一个字符串进行最大匹配法分词的算法,在VC环境下运行即可。-A string of maximum matching word segmentation algorithm can be run in the VC environment.
ICTCLAS
- ICTCLAS分词,来自中科院的分词器,可以提取指纹的等功能-ICTCLAS
divcns
- 分词实现简单中文最新修正版 分词实现简单中文最新修正版-the realization of simple Chinese word segmentation
interest-profile-anonymization
- 本系统通技术运用主要采用Servlet实现,前台页面使用jsp技术,首先接受所要处理的数据集以及参数设置,对用户的搜索内容进行分词、去除停用词,形成用户的兴趣模型;进行用户兴趣模型匿名化:从用户兴趣模型集中选取模型,计算该模型与所有等价组模型的相似性以及计算该模型与其他所有模型的相似性,根据相似性的大小进行聚合成等价组,然后再计算各自兴趣模型的权值,以达到用户兴趣模型的匿名化以及权值的平衡,然后提交到后台进行匿名化操作,最后返回匿名化结果。-The system through the use
wenbchongpaixu
- 这是具有文档间距离的文档重排序算法研究,中文信息处理基于应与与搜索引擎,实现文档的自动分词与索引。-This is the document reordering algorithm based on the distance between the document research, Chinese information processing technology, is used to search engines, to realize automatic document index