搜索资源列表
分词051024
- 中文信息处理,例如将可含有汉字和拼音的将TXT文本中的汉字和拼音用空格隔开-Chinese information processing, for example, may contain characters and the alphabet will TXT version of the characters and the alphabet with a space separated
ictclas_Source_Code
- 计算所汉语词法分析系统ICTCLAS介绍 词是最小的能够独立活动的有意义的语言成分。 但汉语是以字为基本的书写单位,词语之间没有明显的区分标记,因此,中文词语分析是中文信息处理的基础与关键。为此,我们中国科学院计算技术研究所在多年研究基础上,耗时一年研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),该系统的功能有:中文分词;词性标注;未登录词识别。分词正确率高达97
invert10_31
- 中文信息处理,建立文件的倒排表,形成词频链表-Chinese information processing, document the inverted table and form Frequency List
zidongfenci3.0
- 这个是我们的中文信息处理的作业,我是用mfc结合sqlserver写的,可以自己一步一步的进行分词,并且可以对文本进行分词,还可以自己的找到其中的歧义字段,并自动保存到文件
BottomUpParser
- 中文信息处理方面的一个源码,此为自底向上的句法分析程序。功能比较完善,代码简洁易懂。
POSTagger
- 中文信息处理方面的一个源码。此为一个词性标注软件,需要有事先做好的词典的支持。功能强大,代码简洁易懂。
ProbWordSeg
- 中文信息处理方面的一个源码。此为一个分词软件,这个分词的算法虽然简单,但是原理和其他相同,是最大概率法分次。功能强大,代码简洁易懂。
TestMDB
- 中文信息处理方面的一个源码。此为一个拼音分析和生成软件功能强大,代码简洁易懂。 1 可执行程序TestLexicon.exe必须与数据库文件在同一个目录下 2 数据库文件名为: lexicon.mdb,可以是access 97版格式的数据库, 也可以是access 2000版格式的数据库 3 双击TestLexicon.exe启动程序 4 选择“词典数据库”下“词库查询1”等进行查询,状态栏显示每个查询的 区别。程序反馈消息框响应用户的查询。
dict
- 这是我的中文信息处理的小作业,是一个自动分词系统。- This is my Chinese information processing 灏忎綔 industry, is an automatic participle system.
Candidate
- 中文信息处理的有关成员的函数,用VC++编写,只有.cpp文件的详细代码
CProbRule
- 中文信息处理的相关源码,VISUAL C++编写,.cpp文件,具体的实现代码
MainFrm
- 中文信息处理的源程序代码。VC++实现,这是主程序,链接,.cpp文件
PFR199801.rar
- PFR人民日报标注语料,它是中文信息处理的重要训练样本,PFR marked the People' s Daily corpus, which is an important Chinese information processing training samples
softwarecode
- 中文分词是中文信息处理中的重要环节,中文分词技术广泛应用于自动翻译、文本检索、语音识别、文本校对、人工智能以及搜索引擎技术等领域。中文分词算法的选择,中文词库的构建方式,词库中词条的完备性在很大程度上与中文分词系统性能紧密相关。-Chinese word segmentation in Chinese information processing is an important part of Chinese word segmentation technology is widely used
windows_csharp_32
- 中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。ICTCLAS全部采用C/C++编写,支持Linux、FreeBSD及Windows系列操作系统,支持C/C++/C#/Delphi/Java等主流的开发语言
ICTCLAS2010CSharpDemo
- 中文分词源程序, 中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级6次,目前已经升级到了ICTCLAS3.0。ICTCLAS3.0分词速度单机996KB/s,分词精度98.45
wordseg
- 词性标注 中文信息处理 在输入一段文字之后它会分析句子中的各种成分-word segment
1
- 中文分词在中文信息处理中是最最基础的,无论机器翻译亦或信息检索还是其他相关应用,如果涉及中文,都离不开中文分词,因此中文分词具有极高的地位。中文分词入门最简单应该是最大匹配法了-Chinese word segmentation in Chinese information processing is the most basic, whether in machine translation Yihuo information retrieval, or other related appli
SF
- 中文分词在中文信息处理中是最最基础的,无论机器翻译亦或信息检索还是其他相关应用,如果涉及中文,都离不开中文分词,因此中文分词具有极高的地位。中文分词入门最简单应该是最大匹配法-Chinese word segmentation in Chinese information processing is the most basic, whether in machine translation Yihuo information retrieval, or other related applic
中文信息处理发展报告cips2016
- 中文信息处理报告,综述性文章,有较强的学习意义。(The Chinese information processing report, the summary article, has the strong learning significance.)