搜索资源列表
je-analysis-1.5.3
- 最流行,使用方便中文分词包,上次上传的是class文件,这次上传的是jar包,使用更方便,而且是最新版本,分词效果更好。-The most popular and easy to use Chinese word package, the last class file is uploaded, the upload is jar package, easier to use, and is the latest version, word better.
MyPaodingTest
- 一个中文分词 庖丁的测试程序 仅供初学者参考-paoding Test project
chinese-analyzer
- 基于中科院的分词系统修改的java版的中文分词系统-CAS-term system based on the modified version of java Chinese word segmentation system
Ictclas
- 中文分词的java实现实例。包括词性标注和分词等功能。-Chinese word segmentation to achieve the java instance. Including word tagging and other functions.
aimlTranslator
- aimlTranslator是一个aiml文件(人工智能标记语言)翻译工具,同时提供了中文分词选项,可对目录内aiml文件进行批量翻译操作。因为内部调用google翻译api,需要再联网条件下才能进行翻译,处理速度也受网络条件影响。另外还集成了ik Analyzer进行中文分词,可通过设置运行参数只进行中文aiml文件的分词操作,此项不需要网络支持。详情请参考工具使用方法。-aimlTranslator is a aiml file (Artificial Intelligence Markup
AnalyzerTest
- java中文分词lucene,可以实现中英文分词功能,查询功能!-Chinese word java lucene, can be achieved in the English word function, search function!
FMM_RMM
- 中文分词 以及词性标注,在awt界面上将中文分词,用的是最大正向匹配以及反向最大匹配-Chinese word segmentation and tagging, the interface will be in awt Chinese word segmentation, matching with the maximum forward and reverse maximum matching
chinese-analyzer
- java开发的的分词系统修改的的中文分词系统-java development of the sub-system changes the Chinese word segmentation system
ictclas4j
- 中科院中文分词系统完成的java源码,能很好的实现中文的分词,为文本挖掘提供基础。-Chinese Academy of Sciences Chinese word segmentation system to complete the java source code, can achieve good word of Chinese, provide a basis for text mining.
chinese
- java开发的中文分词提取关键字系统源代码,里面有说明文档,可以按步骤使用 -java development of the Chinese word keyword extraction system source code, which has documentation, you can use the step by step
Nlpir
- 前NLPIR汉语分词系统(又名ICTCLAS2013),主要功能包括中文分词;词性标注;命名实体识别;用户词典功能;支持GBK编码、UTF8编码、BIG5编码。新增微博分词、新词发现与关键词提取;张华平博士先后倾力打造十余年,内核升级10次。国内国际排名均为第一。 项目已经配置好环境,导入Eclipse即可使用,文件内src下的TestUTF8.java可以直接运行,提供了分词接口-Before NLPIR Chinese word segmentation system (aka I
FMM
- 中文分词 用来进行将一句话或者一段文字进行分词,可以用搜索引擎方面 -Chinese word
NlPIR
- 实现了中文分词,我还自己加入了if-idf和聚类。-Achieve a Chinese word, I myself joined the if-idf and clustering.
IKAnalyzer2
- 使用IKAnalyzer进行中文分词,输入txt文件。逐行分词-Use IKAnalyzer for Chinese word segmentation, enter txt file. Progressive word
WordSegment
- 中文分词,Java版本,词库已经包括,安装JDK后直接运行里面的WordSegment.java就行了。-Chinese Segment of Java, contains dictionary.It is OK that execute the WordSegment.java after install JDK.
Split
- Java实现逆向最大匹配中文分词算法,本程序可以实现较为简单的中文分词-Java implementation reverse maximum matching Chinese word segmentation algorithm, the program can be implemented relatively simple Chinese word segmentation
Fenci
- 中文分词程序源码,包含所用到的词库词典。-Chinese word segmentation program source code, including the use of the thesaurus dictionary.
fenci
- 基于IKAnalyzer2012的中文分词java代码,可以去除停用词。-The Chinese word segmentation based IKAnalyzer2012 java code, you can remove stop words.
NlPIR
- 中文分词与词频统计 64位 为eclipse工程文件,可直接运行,效果不错-Chinese word and word frequency statistics 64
ExcludeStopWord
- 对一段中文文本经中文分词后,根据停用词表,去除文档中的停用词。-After a period of Chinese text by the Chinese word, according to the stop list, the removal of stop words in the document.