搜索资源列表
NGRAM
- NGRAM中文分词压缩包,应用于网络搜索中的中文分词过程中 -NGRAM Chinese Words Segmentation
fenci
- 可以进行中文分词,准确率可达95 ,可以满足一般的分词需要-Chinese word can be, up to 95 accuracy, to meet the needs of the general word
BayesTest
- IKAnalyzer中文分词器 测试代码 对初学者有用-IKAnalyzer Chinese word Test code useful for beginners
MyICTCLASNew
- 用java写的中文分词系统,绝对能用,欢迎下载-Chinese word segmentation :java
FastSeg
- 搜索引擎相关,中文分词算法,java编写-Search engines related, Chinese word segmentation algorithm, written in Java
ChineseWordSegmentation
- 中文分词处理,复旦大学FudanNLP中的中文分词处理程序-chinese word segmentation
Cs
- 中文分词 chinese word segmentation-chinese word segmentation
chinese-_segmentation
- 中文分词算法介绍,正向最大匹配。word-word for chinese segmentation algrithm
SplitWords
- 中文分词系统,给定一个文档,生成另一个内容已经被分割的文档-The Chinese word segmentation system, given a document, generating another content has been the division of the document
fenci
- 复旦的中文分词java程序包,装了eclipse话,导入项目就能用-Fudan University Chinese word java program package installed eclipse, then import the project will be able to use
chinese-segment
- 中文分词程序,c#编写,输入txt文件,可以输出分词后文章-Chinese word segmentation process, c# prepared to enter the txt file, you can output word article
ansjsun-ansj_seg-fa62737
- 基于JAVA中文分词,为ITEYE开源项目,很好很强大。性能高-JAVA-based Chinese word, very very strong for ITEYE open source project. High-performance
ansj_seg-master
- 这是一个ictclas的java实现.基本上重写了所有的数据结构和算法.词典是用的开源版的ictclas所提供的.并且进行了部分的人工优化 内存中中文分词每秒钟大约100万字(速度上已经超越ictclas) 文件读取分词每秒钟大约30万字 准确率能达到96 以上-This is a ictclas of java. Basically rewrite all the data structures and algorithms. Dictionary is prov
WordSequence
- 正向最大匹配法实现中文分词,并计算其正确率(P)、召回率(R)和F测度-Positive maximum matching method to realize the Chinese word segmentation
HLSeg_JAVA_Example
- 中文分词 支持对输出颗粒的控制,可以输出普通颗粒与用于检索的小颗粒;同时输出词串所在句号、段号、词号、词性等信息。 关于分词输出颗粒,我们认为各种应用对分词要求的颗粒度是不同的. 比如自动分类、关键词抽取比搜索需要的分词颗粒度要大, 因为这样表示文本语义特征时效果会更好, 而检索有一个查全率的要求, 就需要把分词单位做的更为细致, 不然就会造成漏查。 海量系统现在提供了两种颗粒的规则, 其中, 默认的为大颗粒接口, 主要用于自动分类、信息挖潜、机器翻译、语音合成、人工智能等领域,
IKAnalyzer2012
- IKAnalyzer中文分词器V2012使用手册-IKAnalyzer the Chinese word is V2012 user manual
IKAnalyzer2012
- IKAnalyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。-IKAnalyzer is an open source, based on the the lightweight java language development of Chinese word Kit.
MapTest
- 倒排索引,此程序,运用ICTClas分词工具实现的中文分词,并建立倒排索引输出到指定文件。-Inverted index, this procedure, use ICTClas segmentation tool to achieve the Chinese word segmentation and indexing inverted output to the specified file.
chinese
- 中文分词提取关键字源代码,里面有说明文档,可以按步骤使用-Chinese word segmentation to extract keywords source code, which has documented step-by-step
mmseg4j-1.9.1.v20130120-SNAPSHOT
- 2013年的分词器 是搜狗的中文分词器 大家经常用的一版的13年新版-The 2013 segmentation is the the Sogou Chinese word we often use a version of the 13-year new version