搜索资源列表
je-analysis-1.4.0
- 基于java的中文分词系统,直接更改扩展名为jar即可。暂无源码提供
ictclas4j
- 基于中科院的ICTCLAS实现中文分词系统 开发工具是JAVA.经测试,效果很好
paoding-analysis-2.0.4-alpha2
- 对Lcuene的良好的封装,提供了中文分词字典 功能强大
fenci
- 支持java的中文分词程序-support the Chinese word segmentation procedures
perlfenci
- 一个简单的中文分词perl脚本,准确率比中科院的那个组件差点,但是全源码公开,可以扩展
paoding-analysis-2.0.1(UTF-8)
- 庖丁分词模块,对中文分词效果不错,可以好好学习
doc
- 中文分词但事实上生生世世 搜索
ictclas4j_3
- 贝叶斯公式,文本分类,中文分词,在eclipse下打包重新编译通过的,方便实用和开发。
paoding-analysis-2.0.4-beta
- 又一个中文分词组件,作者自称很牛,企业级的,字库很多。也可直接用于lucene索引和搜索。
segmenter
- 一个简单有效的中文分词算法,包含正向最大匹配算法,java实现。
为Ecshop 添加Sphinx全文索引功能主文件
- 把模板里的search.php连接改成这个ftsearch.php,就可以实现中文全文索引功能了. 演示地址:http://www.ueedy.com
网页搜索引擎
- K-PageSearch是由Kwindsoft在2007年自主研发的专为行业、专类信息检索设计的网页搜索引擎。主要功能特点:网络蜘蛛、定向采集、正文提取、中文分词、全文索引、相关度排序、网页快照、相关搜索、竞价排名;后台数据库采用Microsoft SQL Server,静态化搜索系统设计采用XML数据岛缓存搜索结果提高系统的稳定性和性能、节省服务器资源减轻系统负担。 网络蜘蛛 K风蜘蛛组件包括三大功能模块:链接采集、网页分析、无效网页扫描; 自动识别GB2312、BIG5、UTF-8、Unic
IKAnalyzer3.2.8-bin
- IKAnalyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始,IKAnalyzer已经推出 了3个大版本。最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析算法的中文分词组件。新版本的IKAnalyzer3.0则发展为 面向Java的公用分词组件,独立于Lucene项目,同时提供了对Lucene的默认优化实现。 -IKAnalyzer is an open source, java based development o
wordsegment
- 中文分词系统,有IKAnalyzer和MMAnalyzer两种分词方式可供选择,有界面展示,可是清楚的比较两种的特点,各有千秋-Chinese word segmentation system, there are two kinds of segmentation MMAnalyzer IKAnalyzer and methods are available, there are interface shows, but a clear comparison of two characteri
mmseg4j-1.0-src.zip
- java 版的中文分词技术 很实用的 正确率可以达到98 以上,java version of the Chinese word technology is practical accuracy can reach more than 98
IKAnalyzer3.2.8-source
- IKAnalyzer的源码包,实现中文分词功能,(1) 采用了特有的“正向迭代最细粒度切分算法”,具有60万字/ 秒的高速处理能力。 (2) 采用了多子处理器分析模式,支持:英文字母( IP 地址、Email、URL )、数字(日期,常用中文数量词,罗马数字,科学计数法),中文词汇(姓名、地名处理)等分词处理 。 (3) 优化的词典存储,更小的内存占用。支持用户词典扩展定义 (4) 针对 Lucene 全文检索优化的查询分析器 IKQueryParser;采用歧义分析算法优化查询关键
je-analysis-1.5.3.jar
- 搜索引擎开中中文分词包JE分词器 开发者必备哦-Search engine to open in Chinese word segmentation package JE Oh device developers must
lingpipe-3.6.0
- 一个自然语言处理的Java开源工具包。LingPipe目前已有很丰富的功能,包括主题分类(Top Classification)、命名实体识别(Named Entity Recognition)、词性标注(Part-of Speech Tagging)、句题检测(Sentence Detection)、查询拼写检查(Query Spell Checking)、兴趣短语检测(Interseting Phrase Detection)、聚类(Clustering)、字符语言建模(Character
ChineseWordsDemo
- LingPipe(开源自然语言处理的Java开源工具包) 中文分词java程序-LingPipe (open source natural language processing toolkit in Java open source) Chinese word segmentation procedure java
ictclas4j.doc
- ictcasj 中文分词技术 有详细的说明-ictcasj Chinese word segmentation techniques