搜索资源列表
ictclas4j
- 基于中科院的ICTCLAS实现中文分词系统 开发工具是JAVA.经测试,效果很好
paoding-analysis-2.0.4-alpha2
- 对Lcuene的良好的封装,提供了中文分词字典 功能强大
fenci
- 支持java的中文分词程序-support the Chinese word segmentation procedures
paoding-analysis-2.0.1(UTF-8)
- 庖丁分词模块,对中文分词效果不错,可以好好学习
doc
- 中文分词但事实上生生世世 搜索
ictclas4j_3
- 贝叶斯公式,文本分类,中文分词,在eclipse下打包重新编译通过的,方便实用和开发。
paoding-analysis-2.0.4-beta
- 又一个中文分词组件,作者自称很牛,企业级的,字库很多。也可直接用于lucene索引和搜索。
segmenter
- 一个简单有效的中文分词算法,包含正向最大匹配算法,java实现。
IKAnalyzer3.2.8-bin
- IKAnalyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始,IKAnalyzer已经推出 了3个大版本。最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析算法的中文分词组件。新版本的IKAnalyzer3.0则发展为 面向Java的公用分词组件,独立于Lucene项目,同时提供了对Lucene的默认优化实现。 -IKAnalyzer is an open source, java based development o
wordsegment
- 中文分词系统,有IKAnalyzer和MMAnalyzer两种分词方式可供选择,有界面展示,可是清楚的比较两种的特点,各有千秋-Chinese word segmentation system, there are two kinds of segmentation MMAnalyzer IKAnalyzer and methods are available, there are interface shows, but a clear comparison of two characteri
mmseg4j-1.0-src.zip
- java 版的中文分词技术 很实用的 正确率可以达到98 以上,java version of the Chinese word technology is practical accuracy can reach more than 98
IKAnalyzer3.2.8-source
- IKAnalyzer的源码包,实现中文分词功能,(1) 采用了特有的“正向迭代最细粒度切分算法”,具有60万字/ 秒的高速处理能力。 (2) 采用了多子处理器分析模式,支持:英文字母( IP 地址、Email、URL )、数字(日期,常用中文数量词,罗马数字,科学计数法),中文词汇(姓名、地名处理)等分词处理 。 (3) 优化的词典存储,更小的内存占用。支持用户词典扩展定义 (4) 针对 Lucene 全文检索优化的查询分析器 IKQueryParser;采用歧义分析算法优化查询关键
je-analysis-1.5.3.jar
- 搜索引擎开中中文分词包JE分词器 开发者必备哦-Search engine to open in Chinese word segmentation package JE Oh device developers must
lingpipe-3.6.0
- 一个自然语言处理的Java开源工具包。LingPipe目前已有很丰富的功能,包括主题分类(Top Classification)、命名实体识别(Named Entity Recognition)、词性标注(Part-of Speech Tagging)、句题检测(Sentence Detection)、查询拼写检查(Query Spell Checking)、兴趣短语检测(Interseting Phrase Detection)、聚类(Clustering)、字符语言建模(Character
ChineseWordsDemo
- LingPipe(开源自然语言处理的Java开源工具包) 中文分词java程序-LingPipe (open source natural language processing toolkit in Java open source) Chinese word segmentation procedure java
ictclas4j.doc
- ictcasj 中文分词技术 有详细的说明-ictcasj Chinese word segmentation techniques
paoding-analysis-2[1].0.4-beta
- Paoding中文分词参考手册,Paoding中文分-Paoding
Lucene
- Lucene的基于正向最大匹配分析器,用于中文分词,可将查准率提高-Lucene chinese analyzer based by FMM algorithm
SunMap
- 从底层实现的GIS小项目,具有地图的放大、缩小、平移等常用地图操作功能和查询功能等,可以读取多种常用几何类型的shapefile文件,项目中还含有一个MMSeg中文分词器,适合GIS专业的同学科研使用-GIS from the underlying implementation of small projects, with maps, zoom, pan and other commonly used map operation functions and query functions, y
lucene-2.9.1
- Lucene 应该是最新版本的,主要是分词功能和检索功能特别强大,如果要达到中文分词的功能,需要Paoding与其结合才更好-Should be the latest version of Lucene, mainly sub-word features and retrieval is particularly strong, if you want to achieve the Chinese word segmentation functionality, combined with th