搜索资源列表
eeeee
- struts2,spring,hibernate,lucene+IK分词器,实现的手机信息搜索引擎。-struts2, spring, hibernate, lucene+IK word phone information search engine implementation.
Stemmer
- 在英语中,一个单词常常是另一个单词的“变种”,如:happy=>happiness,这里happy叫做happiness的词干(stem)。在信息检索系统中,我们常常做的一件事,就是在Term规范化过程中,提取词干(stemming),即除去英文单词分词变换形式的结尾。 应用最为广泛的、中等复杂程度的、基于后缀剥离的词干提取算法是波特词干算法,也叫波特词干器(Porter Stemmer)。详见官方网站。比较热门的检索系统包括Lucene、Whoosh等中的词干过滤器就是采用的波
totsearch
- 淘特站内搜索引擎(C#版)基于Lucene.Net核心,通过高效的中文分词算法将数据库中内容进行分析、索引并保存至硬盘中。前台搜索时,通过读取索引文件查询,避免了传统数据库查询在高并发及海量数据下的性能问题。因前台搜索不在连接数据库,为不希望数据库放到前台的特殊用户群体提供了数据快速查询解决方案。 -Amoy special stations within the search engine (C# version) is based on Lucene.Net core through e
lucenepds
- lucene全文搜索:实现了分词 索引 查找三大核心模块-lucene text search: the segmentation index to find the three core modules
CWSSFenci
- java基于字典的分词,字典存储结构采用Hash表,并和Lucene的token流接口相结合,可以再lucene中使用-Hash tables java dictionary-based segmentation, dictionary storage structure and lucene in use and Lucene token stream interface combined
SSE
- SSE === small search engine implement ----2013.01.17---- 补充第一份说明,这个项目是三四个月前写的基于Lucene.Net的一个小型通用搜索引擎, 稍迟会补上Demo, 当时的目标是一个通用的索引跟检索架构。 索引方面: 每增加一种需要索引的文档类型,都只需要新建一个类,在类的各个字段上标注上索引信息(如是否需要存储,是否需要分词等)然后又数据源提供实体信息给索引器即可自动索引。
chinese-analyzer
- imdict chinese analyzer分词程序 ,是中科院ICTCALS的重实现,加入了lucene的分词jar包,完整的程序-word program imdict chinese analyzer is the Chinese Academy ICTCALS heavy realize adding a the lucene segmentation jar package, complete program
LuceneStudy
- Lucene搜索引擎的使用例子,其中包括建立索引,检索索引,分词等功能。-The the use of of the Lucene search engine the examples of, which including the establishment of the the function of indexing, case retrieval index, sub-the word, and, etc. on.
IKAnalyzer3.2.0Stable_bin
- IKAnalyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始,IKAnalyzer已经推出了3个大版本。最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析算法的中文分词组件。新版本的IKAnalyzer3.0则发展为面向Java的公用分词组件,独立于Lucene项目,同时提供了对Lucene的默认优化实现。 -IKAnalyzer is an open source toolkit, Chinese word segm
Lucene_segmentation
- 基于Lucene的中文字典分词模块的设计与实现-Lucene-based Chinese dictionary word module design and implementation
Demo
- 基于中科院分词的桌面搜索软件,采用c#开发,lucene内嵌等等。-ICTCLAS desktop search software based on embedded Lucene, using c# development, etc..
WLIndexWorker
- Lucene搜索实例 数据库全文检索 分词搜索-Lucene DEMO
AnalyzerTest
- java中文分词lucene,可以实现中英文分词功能,查询功能!-Chinese word java lucene, can be achieved in the English word function, search function!
jieba-analysis-master
- 结巴分词,在Lucene中用来分词的,该分词器具有自动提取关键字的功能-Stuttered word, the word is used to Lucene, the word has the function of automatic extraction of keywords
lucene4
- LUCENE索引,搜索分词,大数据,云计算-LUCENE index, search word, big data, cloud computing
IKAnalyzer
- IKAnalyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始,IKAnalyzer已经推出了3个大版本。最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析算法的中文分词组件。新版本的IKAnalyzer3.0则发展为面向Java的公用分词组件,独立于Lucene项目,同时提供了对Lucene的默认优化实现。 -IKAnalyzer is an open source, lightweight java-based de
syzlsearch_v2.5
- 基于Lucene开发的站内搜索解决方案,其集成专为站内搜索设计的细粒度中文分词,有效兼顾搜准和搜全率,无缝支持多种数据库数据汇入索引,支持全站,资讯,博客等多类型同时搜索,支持按相关度/时间检索,支持按时间过滤搜索-Based on Lucene development of the station search solution, its integration is designed for the station search and design of fine-grained Chin
SplitWords
- 基于lucene的文档分词程序,去停用词,统计词频,计算词的权重-Lucene-based document segmentation procedures, to stop words, word frequency statistics
syzlsearch_v2.6
- 基于Lucene开发的站内搜索解决方案,其集成专为站内搜索设计的细粒度中文分词,有效兼顾搜准和搜全率,无缝支持多种数据库数据汇入索引,支持全站,资讯,博客等多类型同时搜索,支持按相关度/时间检索,支持按时间过滤搜索,同时还有智能提示,相关搜索,搜索历史记录等实用功能。-Based on Lucene development of the station search solution, which is integrated into the search for the design of t
totsearch_v3.3
- 淘特站内搜索引擎是由淘特JSP搜索引擎发展而来,系统基于Lucene.Net核心,通过高效的中文分词算法将数据库中内容进行分析、索引并保存至硬盘中。前台搜索时,通过读取索引文件查询,避免了传统数据库查询在高并发及海量数据下的性能问题。因前台搜索不在连接数据库,为不希望数据库放到前台的特殊用户群体提供了数据快速查询解决方案。 淘特站内搜索引擎(C#版)v3.3更新内容: 1、解决生成的文件链接始终是第一个的错误 2、解决GbK编码搜索程序Default_Gbk.aspx下一页链接错误的