搜索资源列表
ICTCLAS50_Windows_32_C
- 中科院分析系统 ICTCLAS的主要功能有:中文分词;词性标注;命名实体识别;新闻识别;用户词典-ICTCLAS segementword
Rkeyword-choue
- 基于逆向最大匹配算法的分词及基于HMM模型的词性标注系统,包括了未登登录词的识别、数据库的添加等内容。(需要手动修改数据库的路径才可以运行) -Based on the segmentation of the reverse maximum matching algorithm and the HMM-based POS tagging system, including unadvertised login word recognition, and add the database co
ICTCLAS50_Windows_32_C
- 中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。-New word of the Chinese Academy of Sciences Institute of Computing Technology, Chinese Lexical Ana
design-documents
- 网页信息采集子系统: 网页采集:动态查找及实时分析新增网页,读取网页回帖信息。 网页过滤:,对获取的网页,通过网页清洗模块清除网页中的广告、导航信息、 图片、版权说明等噪声数据,萃取出相关网页的标题、正文、链接地址、采集时 间、回帖、发帖人数等数据。 网页信息预处理子系统: 网页审查脏字:主要功能包括中文分词、词性标注、命名实体识别、新词识别, 建立数据库说明每类词库,建立敏感词词库。 网页舆情监测:监测是否出现了一定影响的舆论,即回帖的回帖或支持、顶等 达到
Chinese-part-of-speech-tagging
- 自然语言处理中汉语词性标注的C程序以及实例实验,-Chinese part-of-speech tagging C++ program as well as instances of experimental
HMMparse
- HMM词性标注,使用MFC界面,标注效果好,供有兴趣的同学们参考-Part-of-speech tagging by using HMM
Wordpos.rar
- java语言实现的关于中文词性标注的问题,在Eclipse上通过编译,可运行。欢迎下载,并提出意见。,java language on the Chinese part-of-speech tagging, in Eclipse through the compiler, you can run the. Welcome to download and make comments.
pfr199801
- PFR人民日报标注语料库(版本1.0,下面简称PFR语料库)是在得到人民日报社新闻信息中心许可的条件下,以1998年人民日报语料为对象,由北京大学计算语言学研究所和富士通研究开发中心有限公司共同制作的标注语料库。为了促进中文信息处理研究的发展,我们三方计划公开PFR语料库。作为公开的前期工作,从4月3日起,在我们三方的主页上免费公开PFR语料库1月份的语料,欢迎大家下载。PFR语料库的制作规范参阅《现代汉语语料库加工――词语切分与词性标注规范》。如果您在研究或论文工作中使用PFR语料库,请注明来
pos_tag
- 用viterbi方法进行词性标注 pos_tag.py 词性标注 evaluate.py 词性标注性能评估 PD_1998_01_POS.txt ”人民日报“语料库 标准词性标注结果.txt 语料库中后10 的数库(分词+词性标注)-Using the viterbi methods for part-of-speech tagging pos_tag.py part-of-speech tagging the evaluate.py speech tagging perform
WordList
- 北京大学分词词表,有属性,是进行分词词性标注的重要资源。-Peking word vocabulary, properties, and is an important resource for sub-word part-of-speech tagging.
nlu_project
- 采用机器学习的方法进行自然语言处理,对中文进行分词和词性标注。分词采用crf模型,词性标注用hmm模型,解码算法为Vertibi算法。本系统使用java语言编写-Using machine learning methods for natural language processing, carried out on the Chinese word segmentation and POS tagging. Segmentation using crf model, tagging with
ik
- 一个简单的IK分词的demo,我建议使用中科院分词,因为支持词性标注-A simple IK word of the demo, I recommend using CAS segmentation because they support tagging
Ictclas
- 中文分词的java实现实例。包括词性标注和分词等功能。-Chinese word segmentation to achieve the java instance. Including word tagging and other functions.
FMM_RMM
- 中文分词 以及词性标注,在awt界面上将中文分词,用的是最大正向匹配以及反向最大匹配-Chinese word segmentation and tagging, the interface will be in awt Chinese word segmentation, matching with the maximum forward and reverse maximum matching
0nlu_project
- 本系统使用java语言编写,采用机器学习的方法进行自然语言处理,对中文进行分词和词性标注。分词采用crf模型,词性标注用hmm模型,解码算法为Vertibi算法。-The system uses java language, using machine learning methods for natural language processing, for Chinese word segmentation and POS tagging. Segmentation using crf mod
chinesesplitp28iccp29
- 中科院切词软件,java版及使用说明,带词性标注.-CAS segmentation software and instructions for use with speech tagging
Nlpir
- 前NLPIR汉语分词系统(又名ICTCLAS2013),主要功能包括中文分词;词性标注;命名实体识别;用户词典功能;支持GBK编码、UTF8编码、BIG5编码。新增微博分词、新词发现与关键词提取;张华平博士先后倾力打造十余年,内核升级10次。国内国际排名均为第一。 项目已经配置好环境,导入Eclipse即可使用,文件内src下的TestUTF8.java可以直接运行,提供了分词接口-Before NLPIR Chinese word segmentation system (aka I
PST-v1.0
- 使用隐马尔科夫模型进行词性标注,数据结构为Trie 树,界面简洁直观,算法效率快-Using hidden Markov model tagging, Trie tree data structures, simple and intuitive interface, fast algorithm efficiency
ltp_new
- 使用哈工大信息检索实验室LTP系统进行分词,词性标注,命名实体识别,依存句法分析,语义角色标注 同时是最新版API使用情况,JAVA版本,并且生成XML文件-Retrieval Laboratory LTP system segmentation, the use of Harbin Institute of technology information of part of speech tagging, named entity recognition, dependency parsi
CRF
- 条件随机场(CRF)由Lafferty等人于2001年提出,结合了最大熵模型和隐马尔可夫模型的特点,是一种无向图模型,近年来在分词、词性标注和命名实体识别等序列标注任务中取得了很好的效果