搜索资源列表
ictclas4j_0[1].9.1
- 基于java语言的分词系统,可以标注词性、词频等信息,可用于二次开发
neucsp
- 很好的分词工具,能对文本进行分词,标注词性,是进行文本聚类不可或缺的工具
c
- ICTCLAS2009的汉语词性标记集,详细列出了ICTCLAS中的标注分类-ICTCLAS2009 Chinese part-of-speech tags set, a detailed list of the ICTCLAS mark classification
The-text-pretreatment_NLP
- NLP 文本预处理—— 标注词性、词频等信息-NLP text preprocessing- part of speech tagging, word frequency and other information
HmmPos
- 本文主要研究在给定的机械词频词典下的基于字符串匹配的中文分词系统,将一整段文字基本正确的切分成词,并标注上词性。在实现分词的过程中,最重要的两个因素就是分词速度和分词精度。因此,我们以分词速度、分词正确率和分词召回率作为中文分词评测标准,力求达到较高的分词速度和分词精度-word Tagging
java调用NPlir
- java调用nplir接口示例,已经能直接导入eclipse运行,具有分词和标注词性功能
HMMallTOOL
- 马尔科夫工具箱是一种统计模型,广泛应用在语音识别,词性自动标注,音字转换,概率文法等各个自然语言处理等应用领域。经过长期发展,尤其是在语音识别中的成功应用,使它成为一种通用的统计工具。-Markov models (Markov Model) is a statistical model, widely used in speech recognition, speech automatic annotation, audio and character conversion, the prob
情感词汇本体
- 中文情感词汇本体库是大连理工大学信息检索研究室在林鸿飞教授的指导下经过全体教研室成员的努力整理和标注的一个中文本体资源。该资源从不同角度描述一个中文词汇或者短语,包括词语词性种类、情感类别、情感强度及极性等信息。(Chinese emotional vocabulary ontology is a Chinese ontology resource which is organized and labeled by the Information Retrieval Research Offic