搜索资源列表
IKAnalyzer3.2.8-source
- IKAnalyzer的源码包,实现中文分词功能,(1) 采用了特有的“正向迭代最细粒度切分算法”,具有60万字/ 秒的高速处理能力。 (2) 采用了多子处理器分析模式,支持:英文字母( IP 地址、Email、URL )、数字(日期,常用中文数量词,罗马数字,科学计数法),中文词汇(姓名、地名处理)等分词处理 。 (3) 优化的词典存储,更小的内存占用。支持用户词典扩展定义 (4) 针对 Lucene 全文检索优化的查询分析器 IKQueryParser;采用歧义分析算法优化查询关键
A200808-601
- 基于C++标准模板类库的全文检索算法 -Based on C++ standard template library of full-text search algorithm
LuceneDesktop_1.0
- lucene的检索算法属于索引检索,即用空间来换取时间,对需要检索的文件、字符流进行全文索引,在检索的时候对索引进行快速的检索,得到检索位置,这个位置记录检索词出现的文件路径或者某个关键词。 -Lucene search algorithm belonging to Index Search, which uses space in exchange for time on the need to retrieve a document, character stream full-text
zhishifencisuanfa
- 基于知识分词算法的病案全文检索系统, 硕士论文.-Knowledge-based segmentation algorithm cases full-text retrieval system, a master s thesis.
qwjs
- 一个简易的asp 网站全文检索程序,经过修正的检索算法,速度、稳定度均有提高。-Asp web site a simple full-text search procedures, the revised search algorithm, the speed of the increase in stability.
bowtie-0.11.3-src
- 快速的序列比对算法,有高效的检索算法在内,对做全文检索的有参考价值。-Fast sequence alignment algorithm, there are efficient retrieval algorithms, including, for to do full-text search of a reference value.
Search-OpenFTS-0.39.tar
- sqlite下的实现全文检索的算法,是搜索算法的基础-implement full-text search,其中sqlite的一个组件
IKAnalyzer3.2.0Stable_src
- IKAnalyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始,IKAnalyzer已经推出了3个大版本。最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析算法的中文分词组件。新版本的IKAnalyzer3.0则发展为面向Java的公用分词组件,独立于Lucene项目,同时提供了对Lucene的默认优化实现。 IKAnalyzer3.0特性: 采用了特有的“正向迭代最细粒度切分算法“,具有60万字/秒的高速处理能力。
PATTree
- 数据结构中PAT树的实现,包括树节点的插入、删除、查找和遍历。PAT tree 在字符串子串匹配上有这非常优异的表现,这使得它经常成为一种高效的全文检索算法,在自然语言处理领域也有广泛的应用。-PAT tree data structure, including the insertion of the tree node, delete, search, and traversal. PAT tree in the string substring match this excellent p
源码_俞育峰
- 知识库管理系统,包含源码和数据库。通过maven构建,使用git版本控制和团队合作,采用springmvc+mybatis框架,集成Lucene全文检索,openoffice转化office文档,ffmpeg处理视频文件,red5搭建流媒体服务,基于pageRank、TF-IDF算法提取处理知识点,webmagic爬取数据,itextpdf、poi处理office等。(knowledge base manage,resource and oracle. maven building)
知识管理系统
- 知识库管理系统,包含源码和数据库。通过maven构建,使用git版本控制和团队合作,采用springmvc+mybatis框架,集成Lucene全文检索,openoffice转化office文档,ffmpeg处理视频文件,red5搭建流媒体服务,基于pageRank、TF-IDF算法提取处理知识点,webmagic爬取数据,itextpdf、poi处理office等。