搜索资源列表
ictclas_Source_Code
- 计算所汉语词法分析系统ICTCLAS介绍 词是最小的能够独立活动的有意义的语言成分。 但汉语是以字为基本的书写单位,词语之间没有明显的区分标记,因此,中文词语分析是中文信息处理的基础与关键。为此,我们中国科学院计算技术研究所在多年研究基础上,耗时一年研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),该系统的功能有:中文分词;词性标注;未登录词识别。分词正确率高达97
invert10_31
- 中文信息处理,建立文件的倒排表,形成词频链表-Chinese information processing, document the inverted table and form Frequency List
MATLAB7.x_signalprocessing
- 《MATLAB7.x数字信号处理》源代码。本书面向信号处理领域,在简要介绍信号处理基本概念的基础上,详细介绍了MATLAB工具箱函数及其使用,内容涵盖了MATLAB使用基础、高级编程和重要领域的应用。在结构安排上,本书立足于信号处理各个具体领域,并结合信息处理工具箱,以大量的程序访真为依托,讲解了MATLAB在信号处理中的具体应用。 本书结构合理,内容全面,图文并茂,实例丰富,适用面广,适合信号处理、自动控制、机械电子、自动化、电力电气、通信工程等专业的本科生、研究生、教师和科技工作者阅读。
FlexCRFs-0.3
- Hieu Xuan Phan & Minh Le Nguyen 利用CRF统计模型写的可用于英文命名实体识别、英文分词的工具(开放源码)。CRF模型最早由Lafferty提出,全名conditional random fields,该模型后来被广泛地应用在语言和图像处理领域,并随之出现了很多的变体。FlexCRF就是对CRF模型的一个实现应用工具,可用于文本信息处理
zidongfenci3.0
- 这个是我们的中文信息处理的作业,我是用mfc结合sqlserver写的,可以自己一步一步的进行分词,并且可以对文本进行分词,还可以自己的找到其中的歧义字段,并自动保存到文件
GBK
- 汉字信息处理的,主要功能是转换字符成GBK码,方便查用
BottomUpParser
- 中文信息处理方面的一个源码,此为自底向上的句法分析程序。功能比较完善,代码简洁易懂。
POSTagger
- 中文信息处理方面的一个源码。此为一个词性标注软件,需要有事先做好的词典的支持。功能强大,代码简洁易懂。
ProbWordSeg
- 中文信息处理方面的一个源码。此为一个分词软件,这个分词的算法虽然简单,但是原理和其他相同,是最大概率法分次。功能强大,代码简洁易懂。
TestMDB
- 中文信息处理方面的一个源码。此为一个拼音分析和生成软件功能强大,代码简洁易懂。 1 可执行程序TestLexicon.exe必须与数据库文件在同一个目录下 2 数据库文件名为: lexicon.mdb,可以是access 97版格式的数据库, 也可以是access 2000版格式的数据库 3 双击TestLexicon.exe启动程序 4 选择“词典数据库”下“词库查询1”等进行查询,状态栏显示每个查询的 区别。程序反馈消息框响应用户的查询。
dict
- 这是我的中文信息处理的小作业,是一个自动分词系统。- This is my Chinese information processing 灏忎綔 industry, is an automatic participle system.
speech_toolboxes
- 语音信号处理工具箱,又许多可以用得着,本人是学信号与信息处理的
MFITOUT
- 此为信号与信息处理领域应用性原程序。也是信号处理领域经典代码
MDECINT
- 信号与信息处理领域经典算法实现,是研究这一领域的人士的重要参考资料。
518
- 法英汉电子技术和信息处理词典 (pdf内容格式)
MainFrm
- 中文信息处理的源程序代码。VC++实现,这是主程序,链接,.cpp文件
OnCorpusNew
- 中文信息处理的源程序,用于分词过程中的歧义鉴别与排除,vc++编写,.cpp文件
taggingPOS
- 中文信息处理的源程序,用于设置词汇在文本中的位置信息,vc++编程,.cpp文件
PFR199801.rar
- PFR人民日报标注语料,它是中文信息处理的重要训练样本,PFR marked the People' s Daily corpus, which is an important Chinese information processing training samples
KaiYuanIctclas
- ICTCLAC开源代码,可用在中文文本信息处理上,为信息抽取进行中文分词、词性标注处理,准确度达到85 以上,-failed to translate
