搜索资源列表
FreeICTCLAS.zip
- 计算所汉语词法分析系统ICTCLAS.分词正确率高达97.58%(973专家组评测),未登录词识别召回率均高于90%,其中中国人名的识别召回率接近98%处理速度为31.5Kbytes/s。ICTCLAS的特色还在于:可以根据需要输出多个高概率结果,有多种输出格式,支持北大词性标注集,973专家组给出的词性标注集合。
hlssplit
- 海天智能分词系统源码,可以根据需要设置分词的粒度,另外提供了词性标注,关键字提取等功能-sky Intelligent Word system source code, according to the need for segmentation of granularity, the provision of tagging, keyword extraction functions
ictclas_Source_Code
- 计算所汉语词法分析系统ICTCLAS介绍 词是最小的能够独立活动的有意义的语言成分。 但汉语是以字为基本的书写单位,词语之间没有明显的区分标记,因此,中文词语分析是中文信息处理的基础与关键。为此,我们中国科学院计算技术研究所在多年研究基础上,耗时一年研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),该系统的功能有:中文分词;词性标注;未登录词识别。分词正确率高达97
PosTagger.exe
- 这是一个文本标注的软件,点击它后可以对输入文本进行分词、标注-This is a markup software, it hits right after importation of text-term Tagging
wordpos
- 给定带有分词和词性标注信息语料,从中总结单词的词频,并按照出现次数排序输出-given with sub-term and part-of-speech tagging information corpus, it is concluded that the words and phrases, and in accordance with the order of the output frequency
postag_convert
- 一个集分词、词性标注和格式转换的强大的工具包-a word, part of speech tagging format conversion and a powerful tool kits
ictclas4j_0[1].9.1
- 基于java语言的分词系统,可以标注词性、词频等信息,可用于二次开发
neucsp
- 很好的分词工具,能对文本进行分词,标注词性,是进行文本聚类不可或缺的工具
FreeICTCLAS
- 中科院的汉语词法分析系统ICTCLAS,主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。
cutdic
- 用于中文分词的切分词典,还有词性标注,以这个词典数据库为基础建立文本分类,文本检索或文本过滤可以节省很多时间.很全,强烈推荐!-for the Chinese word segmentation Dictionary, and tagging to the dictionary database based text classification, text retrieval or text filtering can save a lot of time. All very strongly
Codes and Application
- 这是一个中科院中文词法分析器,能对输入的文本进行分词,词性标注,未登陆词识别等功能,正确率相当高,很有用哦-This is an Academia Sinica Chinese morphology analyzer, can carry on the participle to the input text, the lexical category sign note, has not landed function and so on word recognition, correct r
segtag.rar
- 基于隐马尔科夫模型的分词标注程序,使用PASCAL语言编写,Hidden Markov Model-based sub-word tagging procedures, using the PASCAL language
HMM21.rar
- 基于隐马尔科夫模型的分词,标注,词法分析的资料,Hidden Markov Model-based sub-word tagging information
ICTCLAS50_Windows_64_C
- 中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上,研制了汉语词法分析系统ICTCLAS(Institute of Computing Technology,Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典;支持繁体中文;支持gb2312、GBK、UTF8等多种编码格式。 ICTCLAS分词速度单机500KB/s,分词精度98.45 ,API不超过100kb,各种词典
Chinese-Word-Segment-And-POS-Tagger
- 实现了中文分词和词性标注程序。分词方法采用“三词正向最长匹配”。词性标注使用HMM方法,用Viterbi算法实现。“三词正向最长匹配”保持了“正向最长匹配算法”快速的特点,同时提高了分词的准确性。-Chinese word segmentation and implemented procedures for POS tagging. Segmentation Methods, " the longest three-match positive words." POS tag
CRFPP0[1].53
- 条件随机域,主要用于标记序列,可以进行分词,词性标注,句法分析,以及文本抽取等。-condition random field
Free-Software
- 计算所汉语词法分析系统之免费版本ICTCLAS.非收费之源代码。 分词正确率高达97.58 (973专家组评测),未登录词识别召回率均高于90 ,其中中国人名的识别召回率接近98 处理速度为31.5Kbytes/s。ICTCLAS的特色还在于:可以根据需要输出多个高概率结果,有多种输出格式,支持北大词性标注集,973专家组给出的词性标注集合。--Calculate the Chinese Lexical Analysis System ICTCLAS. Segmentation correc
lingpipe-3.6.0
- 一个自然语言处理的Java开源工具包。LingPipe目前已有很丰富的功能,包括主题分类(Top Classification)、命名实体识别(Named Entity Recognition)、词性标注(Part-of Speech Tagging)、句题检测(Sentence Detection)、查询拼写检查(Query Spell Checking)、兴趣短语检测(Interseting Phrase Detection)、聚类(Clustering)、字符语言建模(Character
gpom
- 这是一个文本标注的软件,点击它后可以对输入文本进行分词,标注-This is a text annotation software, click on it after the input text participle, labeling
61836700
- 这是一个文本标注的软件,点击它后可以对输入文本进行分词,标注(This is a text annotation software, click on it after the input text participle, labeling)