搜索资源列表
IK-Analyzer-2012_u6_source
- IK Analyzer 2012 中文分词系统源码-source code of IK Analyzer 2012 chinese segmentation
NLPIR-JNI
- 这是张华平博士发布NLPIR汉语分词系统(又名ICTCLAS2013).可用于对语料进行分词,预处理.-ictclass word split
GP
- 一个简单的中文分词系统,基于正向最大匹配算法和逆向最大匹配算法。-A simple Chinese word segmentation system, based on the forward and reverse maximum matching algorithm maximum matching algorithm.
ICTCLAS50_Windows_32_JNI
- 中科院分词系统的download下来的源码,看看,可用-source code of word parsing downloaded from CAS
chinese-word-ppl
- 中文分词以及具有简单界面中文分词系统,使用双向匹配算法,并可选择算法不同进行分词-Chinese word segmentation, and has a simple interface Chinese word segmentation system
cpp
- 分词系统的原理是基于词典匹配进行分词,就是说它会先去文件的一行,在去这行中的四个字然后去和词典比较,如果词典中有这个字则输出加空格,如果没有则把左边的字去除剩下3个字后再和词典进行比较-The principle of word segmentation system is based on word segmentation dictionary matching, which means it will go first to file a line, in the four words i
chinese-analyzer
- java开发的的分词系统修改的的中文分词系统-java development of the sub-system changes the Chinese word segmentation system
ictclas4j
- 中科院中文分词系统完成的java源码,能很好的实现中文的分词,为文本挖掘提供基础。-Chinese Academy of Sciences Chinese word segmentation system to complete the java source code, can achieve good word of Chinese, provide a basis for text mining.
Nlpir
- 前NLPIR汉语分词系统(又名ICTCLAS2013),主要功能包括中文分词;词性标注;命名实体识别;用户词典功能;支持GBK编码、UTF8编码、BIG5编码。新增微博分词、新词发现与关键词提取;张华平博士先后倾力打造十余年,内核升级10次。国内国际排名均为第一。 项目已经配置好环境,导入Eclipse即可使用,文件内src下的TestUTF8.java可以直接运行,提供了分词接口-Before NLPIR Chinese word segmentation system (aka I
567657
- SCWS是Simple Chinese Word Segmentation的首字母缩写(即:简易中文分词系统)。 这是一套基于词频词典的机械式中文分词引擎,它能将一整段的中文文本基本正确地切分成词。 词是中文的最小语素单位,但在书写时并不像英语会在词之间用空格分开, 所以如何准确并快速分词一直是中文分词的攻关难点。 -SCWS initials Simple Chinese Word Segmentation abbreviations (ie: Simple Chinese
Windows_32_C_Demo
- ICTCLAS 汉语分词系统 pku_test.txt 未经过分词的文档文件 调用ICTCLAS程序对其中的文档进行分词 -ICTCLAS Chinese word segmentation system pku_test.txt word document file without calling undue ICTCLAS program on which the document word
matching-Chinese-word-by-HMM-and-MM
- 该程序为在MFC下开发的正向和反向两种中文分词系统。-The program was developed in MFC under both positive and negative Chinese word segmentation system.
HmmPos
- 本文主要研究在给定的机械词频词典下的基于字符串匹配的中文分词系统,将一整段文字基本正确的切分成词,并标注上词性。在实现分词的过程中,最重要的两个因素就是分词速度和分词精度。因此,我们以分词速度、分词正确率和分词召回率作为中文分词评测标准,力求达到较高的分词速度和分词精度-word Tagging
initial
- 中科院分词系统,C++版,简单调用接口实现分词示例。(只需更改主函数中目标文件名即可)-CAS segmentation system, C++ version, simply call the interface segmentation examples. (Just change the primary function of the target file name)
C_FF
- 基于字典的分词系统,使用字典对文本进行分词。-Dictionary-based word segmentation system
JnaTest_V1
- 基于中科院NLPIR分词系统做的分词以及新词发现系统,第二十届全国信息检索学术会议(CCIR2014)题目2.3,微博新词发现与情感分析的源码,可处理大语料的微博出局-Based on NLPIR Chinese Academy of Sciences, to solve the problem CCIR2014,Blog content s new words discover and sentiment classify.
JnaTest_V1
- 调用ICTCLAS2014分词系统进行新词发现的Java接口代码。-Call ICTCLAS2014 segmentation system Java interface code found new words.
SharpICTCLAS1.1
- 汉语分词系统,讲一句话中的词语提取出来,如“我们是学生”提取出“我们”,“是”, 学生 -Chinese word segmentation system, speak a word of words extracted...
omp_tokenize
- 用openMP实现的多线程的分词系统,输入是一段文本,输出是分词过的结果集。-OpenMP is used to implement multithreaded word segmentation system, the input is a text, the output is a participle result set.
MMSeg
- 中文自动分词系统,java编写,有界面。可以实现正向最大匹配FMM和逆向最大匹配B-Chinese automatic segmentation system, java write, there are interfaces. You can achieve maximum matching FMM forward and reverse maximum matching BMM