搜索资源列表
ICTCLAS2010CSharpDemo
- 中文分词源程序, 中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级6次,目前已经升级到了ICTCLAS3.0。ICTCLAS3.0分词速度单机996KB/s,分词精度98.45
ctbparser_0.10.tar
- ctbparser是一个开源的中文句法分析工具包,用于分词、词性标注、依存句法分析-ctbparser is an open source Chinese parsing toolkit for Chinese word segmentation, POS tagging, dependency parsing
ctbparser_0.11.tar
- ctbparser是一个开源的中文句法分析工具包,用于分词、词性标注、依存句法分析-ctbparser is an open source Chinese parsing toolkit for Chinese word segmentation, POS tagging, dependency parsing
1998renminribaodaiyoucixingbiaozhu
- 语音合成训练用语料,分词并带有词性标注。文档性质不是源码。-TTS language training materials, word and with part of speech tagging. The nature of the document is not a source.
windows_c_32
- 中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级6次,目前已经升级到了ICTCLAS3.0。ICTCLAS3.0分词速度单机996KB/s,分词精度98.45 ,API不超过2
ICTCLAS
- 中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级7次,目前已经升级到了ICTCLAS2009。-Institute of Computing Technology, Chinese Academy of resear
ICTCLAS50_Windows_32_JNI
- 中科院开发的中文分词算法,带词性标注等,经典的一个算法-Chinese Academy of Sciences of the Chinese word segmentation algorithm developed, with part of speech tagging, etc., a classic algorithm
_gparser
- 自然语言描述和处理的vs2008,包括分词,词性标注等-Natrual language processing, parse word, word meaning etc.
Finite-automata
- 基于有限自动机的词性标注方法,利用自动机进行状态转化,速度很快-Part of speech tagging method based on finite automata, automata for state transformation, very fast.
ICTCLAS50_Windows_32_C
- 中科院分析系统 ICTCLAS的主要功能有:中文分词;词性标注;命名实体识别;新闻识别;用户词典-ICTCLAS segementword
Rkeyword-choue
- 基于逆向最大匹配算法的分词及基于HMM模型的词性标注系统,包括了未登登录词的识别、数据库的添加等内容。(需要手动修改数据库的路径才可以运行) -Based on the segmentation of the reverse maximum matching algorithm and the HMM-based POS tagging system, including unadvertised login word recognition, and add the database co
ICTCLAS50_Windows_32_C
- 中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。-New word of the Chinese Academy of Sciences Institute of Computing Technology, Chinese Lexical Ana
Chinese-part-of-speech-tagging
- 自然语言处理中汉语词性标注的C程序以及实例实验,-Chinese part-of-speech tagging C++ program as well as instances of experimental
HMMparse
- HMM词性标注,使用MFC界面,标注效果好,供有兴趣的同学们参考-Part-of-speech tagging by using HMM
Wordpos.rar
- java语言实现的关于中文词性标注的问题,在Eclipse上通过编译,可运行。欢迎下载,并提出意见。,java language on the Chinese part-of-speech tagging, in Eclipse through the compiler, you can run the. Welcome to download and make comments.
pfr199801
- PFR人民日报标注语料库(版本1.0,下面简称PFR语料库)是在得到人民日报社新闻信息中心许可的条件下,以1998年人民日报语料为对象,由北京大学计算语言学研究所和富士通研究开发中心有限公司共同制作的标注语料库。为了促进中文信息处理研究的发展,我们三方计划公开PFR语料库。作为公开的前期工作,从4月3日起,在我们三方的主页上免费公开PFR语料库1月份的语料,欢迎大家下载。PFR语料库的制作规范参阅《现代汉语语料库加工――词语切分与词性标注规范》。如果您在研究或论文工作中使用PFR语料库,请注明来
pos_tag
- 用viterbi方法进行词性标注 pos_tag.py 词性标注 evaluate.py 词性标注性能评估 PD_1998_01_POS.txt ”人民日报“语料库 标准词性标注结果.txt 语料库中后10 的数库(分词+词性标注)-Using the viterbi methods for part-of-speech tagging pos_tag.py part-of-speech tagging the evaluate.py speech tagging perform
WordList
- 北京大学分词词表,有属性,是进行分词词性标注的重要资源。-Peking word vocabulary, properties, and is an important resource for sub-word part-of-speech tagging.
nlu_project
- 采用机器学习的方法进行自然语言处理,对中文进行分词和词性标注。分词采用crf模型,词性标注用hmm模型,解码算法为Vertibi算法。本系统使用java语言编写-Using machine learning methods for natural language processing, carried out on the Chinese word segmentation and POS tagging. Segmentation using crf model, tagging with
chinesesplitp28iccp29
- 中科院切词软件,java版及使用说明,带词性标注.-CAS segmentation software and instructions for use with speech tagging