搜索资源列表
cvery_5271615762
- 这是一个中文分词的原代码 是用C++编写的
Dict
- 中文分词词典,可以用来进行中文分词。 一个比较全面的词库。
Cidianku2
- 词库,delphi,中文分词软件,还不是很完善,请高手加以改进.
ictclas4j_3
- 贝叶斯公式,文本分类,中文分词,在eclipse下打包重新编译通过的,方便实用和开发。
classify
- 中文分类的关键技术,包括中文分词,特征提取等信息
sousuo_yinqin
- 搜索引擎 毕业论文:本文阐述了搜索引擎的基本原理,着重分析了中文分词的设计与实现
paoding
- paoding的中文分词程序,效果还可以.这个可以作为一些基本应用的分词.
FreeICTCLAS
- 中科院的汉语词法分析系统ICTCLAS,主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。
mmseg-v0.3
- 基于词库的中文分词组件,可以直接用于Lucene的索引建立。以及中文搜索。
paoding-analysis-2.0.4-beta
- 又一个中文分词组件,作者自称很牛,企业级的,字库很多。也可直接用于lucene索引和搜索。
segmenter
- 一个简单有效的中文分词算法,包含正向最大匹配算法,java实现。
wordpress-seo
- WordPress SEO 中文插件 就是利用中文分词给日志建议关键字,并利用关键字对你博客进行 SEO。 1.修正了无法访问分词服务器错误信息 2.修正了没有目录出现的错误信息 3.修正了在编写文章时由于自动存储文章而无法在发表文章时根据全文获取中文关键词的bug 4.增加了使用函数用户自定义相关文章的功能输出位置的功能(傻瓜功能保留) 5.增加首页是否显示相关文章的选项(未完成) 6.如果相关文章不存在,则随机输出文章 7.将中文关键词更换为链接的形式 8.将文章内容中的关键词替换为链接
WeDataMine
- Web挖掘技术在搜索引擎中的应用与实现 介绍了PageRange , 结构挖掘器 , 页面分析器,中文分词等技术
ACWPSv3rar
- 爱博汉语分词系统,是中文分词的商业话应用,非常好。
IKAnalyzer2.0.2
- Java lucene开源全文搜索,中文分词组件
ChineseTokenizer
- 用C#写的中文分词程序,还没有编译,有需要的编译一下吧
wordsegmenter_0.2.2_src
- 这是用C写的中文分词程序,还没通过编译,有需要的大家
dartsplitter
- 这是关于中文分词的有关程序,有正在做中文分词的朋友可以拿去参考一下
splittertest
- 这是有关中文分词的程序、若有需要的话可以参考一下,很有参考价值的哦
Chinesesegmentbasedonwordlibrary
- 具有三级索引词库结构的中文分词方法研究