搜索资源列表
WordSequence
- 正向最大匹配法实现中文分词,并计算其正确率(P)、召回率(R)和F测度-Positive maximum matching method to realize the Chinese word segmentation
HLSeg_JAVA_Example
- 中文分词 支持对输出颗粒的控制,可以输出普通颗粒与用于检索的小颗粒;同时输出词串所在句号、段号、词号、词性等信息。 关于分词输出颗粒,我们认为各种应用对分词要求的颗粒度是不同的. 比如自动分类、关键词抽取比搜索需要的分词颗粒度要大, 因为这样表示文本语义特征时效果会更好, 而检索有一个查全率的要求, 就需要把分词单位做的更为细致, 不然就会造成漏查。 海量系统现在提供了两种颗粒的规则, 其中, 默认的为大颗粒接口, 主要用于自动分类、信息挖潜、机器翻译、语音合成、人工智能等领域,
IKAnalyzer2012
- IKAnalyzer中文分词器V2012使用手册-IKAnalyzer the Chinese word is V2012 user manual
IKAnalyzer2012
- IKAnalyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。-IKAnalyzer is an open source, based on the the lightweight java language development of Chinese word Kit.
MapTest
- 倒排索引,此程序,运用ICTClas分词工具实现的中文分词,并建立倒排索引输出到指定文件。-Inverted index, this procedure, use ICTClas segmentation tool to achieve the Chinese word segmentation and indexing inverted output to the specified file.
chinese
- 中文分词提取关键字源代码,里面有说明文档,可以按步骤使用-Chinese word segmentation to extract keywords source code, which has documented step-by-step
mmseg4j-1.9.1.v20130120-SNAPSHOT
- 2013年的分词器 是搜狗的中文分词器 大家经常用的一版的13年新版-The 2013 segmentation is the the Sogou Chinese word we often use a version of the 13-year new version
je-analysis-1.5.3
- 最流行,使用方便中文分词包,上次上传的是class文件,这次上传的是jar包,使用更方便,而且是最新版本,分词效果更好。-The most popular and easy to use Chinese word package, the last class file is uploaded, the upload is jar package, easier to use, and is the latest version, word better.
MyPaodingTest
- 一个中文分词 庖丁的测试程序 仅供初学者参考-paoding Test project
chinese-analyzer
- 基于中科院的分词系统修改的java版的中文分词系统-CAS-term system based on the modified version of java Chinese word segmentation system
Ictclas
- 中文分词的java实现实例。包括词性标注和分词等功能。-Chinese word segmentation to achieve the java instance. Including word tagging and other functions.
aimlTranslator
- aimlTranslator是一个aiml文件(人工智能标记语言)翻译工具,同时提供了中文分词选项,可对目录内aiml文件进行批量翻译操作。因为内部调用google翻译api,需要再联网条件下才能进行翻译,处理速度也受网络条件影响。另外还集成了ik Analyzer进行中文分词,可通过设置运行参数只进行中文aiml文件的分词操作,此项不需要网络支持。详情请参考工具使用方法。-aimlTranslator is a aiml file (Artificial Intelligence Markup
AnalyzerTest
- java中文分词lucene,可以实现中英文分词功能,查询功能!-Chinese word java lucene, can be achieved in the English word function, search function!
FMM_RMM
- 中文分词 以及词性标注,在awt界面上将中文分词,用的是最大正向匹配以及反向最大匹配-Chinese word segmentation and tagging, the interface will be in awt Chinese word segmentation, matching with the maximum forward and reverse maximum matching
chinese-analyzer
- java开发的的分词系统修改的的中文分词系统-java development of the sub-system changes the Chinese word segmentation system
ictclas4j
- 中科院中文分词系统完成的java源码,能很好的实现中文的分词,为文本挖掘提供基础。-Chinese Academy of Sciences Chinese word segmentation system to complete the java source code, can achieve good word of Chinese, provide a basis for text mining.
chinese
- java开发的中文分词提取关键字系统源代码,里面有说明文档,可以按步骤使用 -java development of the Chinese word keyword extraction system source code, which has documentation, you can use the step by step
Nlpir
- 前NLPIR汉语分词系统(又名ICTCLAS2013),主要功能包括中文分词;词性标注;命名实体识别;用户词典功能;支持GBK编码、UTF8编码、BIG5编码。新增微博分词、新词发现与关键词提取;张华平博士先后倾力打造十余年,内核升级10次。国内国际排名均为第一。 项目已经配置好环境,导入Eclipse即可使用,文件内src下的TestUTF8.java可以直接运行,提供了分词接口-Before NLPIR Chinese word segmentation system (aka I
FMM
- 中文分词 用来进行将一句话或者一段文字进行分词,可以用搜索引擎方面 -Chinese word
NlPIR
- 实现了中文分词,我还自己加入了if-idf和聚类。-Achieve a Chinese word, I myself joined the if-idf and clustering.