搜索资源列表
MyWordSpliter1
- java实现的分词程序,Nutch中文分词-java implementation of segmentation procedures
IKAnalyzer_V3.2.8
- IK Analyzer是一个开源的,基于java诧言开发的轻量级的中文分词工具包。最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析算法的中文分词组件。新版本的IK Analyzer 3.X则发展为面吐Java的公用分词组件,独立于Lucene项目,同时提供了对Lucene的默认优化实现。-IK Analyzer 3.X
CJK
- CJK中文分词压缩包,应用于网络搜索技术中的中文分词-CJK Chinese Words Segmentation
CN
- CN中文分词压缩包,应用于网络搜索中的中文分词过程中-CN Chinese Words Segmentation
IK
- IK中文分词压缩包,应用于网络搜索中的中文分词过程中-IKChinese Words Segmentation
JE
- JE中文分词压缩包,应用于网络搜索中的中文分词过程中 -JE Chinese Words Segmentation
NGRAM
- NGRAM中文分词压缩包,应用于网络搜索中的中文分词过程中 -NGRAM Chinese Words Segmentation
fenci
- 可以进行中文分词,准确率可达95 ,可以满足一般的分词需要-Chinese word can be, up to 95 accuracy, to meet the needs of the general word
BayesTest
- IKAnalyzer中文分词器 测试代码 对初学者有用-IKAnalyzer Chinese word Test code useful for beginners
MyICTCLASNew
- 用java写的中文分词系统,绝对能用,欢迎下载-Chinese word segmentation :java
sphider-1.3.5Chris
- sphider是一个开源的轻量级php+mysql全文搜索引擎,带蜘蛛功能,但是对中文支持不友好。 本版本对后台界面进行了汉化,并且对编码及数据库进行了utf8编码统一,完美解决中文乱码问题。 同时应用scws分词系统解决中文分词问题,并修正了中文搜索时不能正确返回信息的bug。 是搜索引擎开发入门的理想之选。-sphider is an open source lightweight php mysql full-text search engine, with the spider fu
FastSeg
- 搜索引擎相关,中文分词算法,java编写-Search engines related, Chinese word segmentation algorithm, written in Java
ChineseWordSegmentation
- 中文分词处理,复旦大学FudanNLP中的中文分词处理程序-chinese word segmentation
Cs
- 中文分词 chinese word segmentation-chinese word segmentation
chinese-_segmentation
- 中文分词算法介绍,正向最大匹配。word-word for chinese segmentation algrithm
SplitWords
- 中文分词系统,给定一个文档,生成另一个内容已经被分割的文档-The Chinese word segmentation system, given a document, generating another content has been the division of the document
fenci
- 复旦的中文分词java程序包,装了eclipse话,导入项目就能用-Fudan University Chinese word java program package installed eclipse, then import the project will be able to use
chinese-segment
- 中文分词程序,c#编写,输入txt文件,可以输出分词后文章-Chinese word segmentation process, c# prepared to enter the txt file, you can output word article
ansjsun-ansj_seg-fa62737
- 基于JAVA中文分词,为ITEYE开源项目,很好很强大。性能高-JAVA-based Chinese word, very very strong for ITEYE open source project. High-performance
ansj_seg-master
- 这是一个ictclas的java实现.基本上重写了所有的数据结构和算法.词典是用的开源版的ictclas所提供的.并且进行了部分的人工优化 内存中中文分词每秒钟大约100万字(速度上已经超越ictclas) 文件读取分词每秒钟大约30万字 准确率能达到96 以上-This is a ictclas of java. Basically rewrite all the data structures and algorithms. Dictionary is prov