搜索资源列表
paoding-analysis-2.0.4-alpha2
- 对Lcuene的良好的封装,提供了中文分词字典 功能强大
fenci
- 支持java的中文分词程序-support the Chinese word segmentation procedures
src_seg(java)
- 一个用java语言编写的中文文本分词算法
HLSSplit
- 重新写的海量分词研究版的JNI程序,对以前的不能使用import的问题进行修改,没有使用时间限制,做了几个方便用的接口。
javapiler
- 编译原理课程实验,在VC平台实现了java语言的分词程序
fenci
- java版的分词程序,可以灵活生成添加字典。
src
- 基于词典的最大分词算法 达到很好的分词准确率
paoding-analysis-2.0.1(UTF-8)
- 庖丁分词模块,对中文分词效果不错,可以好好学习
doc
- 中文分词但事实上生生世世 搜索
ictclas4j_3
- 贝叶斯公式,文本分类,中文分词,在eclipse下打包重新编译通过的,方便实用和开发。
java1
- 一个java的分词程序,希望对大家有用,分词的效率还可以
src
- 一个用于搜索分词的项目,已经内置了10万的词汇量
paoding-analysis-2.0.4-beta
- 又一个中文分词组件,作者自称很牛,企业级的,字库很多。也可直接用于lucene索引和搜索。
segmenter
- 一个简单有效的中文分词算法,包含正向最大匹配算法,java实现。
javasegment
- java开发的智能分词系统,经过编译可以运行!
IKAnalyzer3.2.8-bin
- IKAnalyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始,IKAnalyzer已经推出 了3个大版本。最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析算法的中文分词组件。新版本的IKAnalyzer3.0则发展为 面向Java的公用分词组件,独立于Lucene项目,同时提供了对Lucene的默认优化实现。 -IKAnalyzer is an open source, java based development o
wordsegment
- 中文分词系统,有IKAnalyzer和MMAnalyzer两种分词方式可供选择,有界面展示,可是清楚的比较两种的特点,各有千秋-Chinese word segmentation system, there are two kinds of segmentation MMAnalyzer IKAnalyzer and methods are available, there are interface shows, but a clear comparison of two characteri
classification
- 文本分来,文中进行了分词,去停用词,用TFIDF来实现-Text, the text for the word, to stop words, to achieve with TFIDF
ictclas
- 分词工具,用Java实现,准确率很好,有很强的学习价值。-Segmentation tool, implemented in Java, good accuracy, has a strong learning value.
ictclas.rar
- Java中lucene分词需要的ICTCLAS.dll文件和data词库,Java Lucene participle in need ICTCLAS.dll documents and data thesaurus