搜索资源列表
POSTagger
- (1)从已经标注好词性的语料中统计得到词性标记的二元转移矩阵,以及每个词以确定的词性标记出现的次数等数据(训练阶段) (2)利用动态规划算法快速选取词性标记路径,得到词性标记结果 (3)可以选择不同的词性标记集 -(1) from the good part-of-speech tagging has been the Corpus statistics to be part of speech marking the transfer of binary matrix, a
wordpos
- 给定带有分词和词性标注信息语料,从中总结单词的词频,并按照出现次数排序输出-given with sub-term and part-of-speech tagging information corpus, it is concluded that the words and phrases, and in accordance with the order of the output frequency
jiyinjiance20070407
- 1. 对给定语料估计其基音周期。 要求用MATLAB语言实现有关基音检测算法,并给出检测结果。2. 实验语料:aoYiSheng.raw 发音:“茅以升”;时长0.9s;采样率:8kHz;量化精度为16bits/sample;数据格式 LSB,MSB分析帧长:20ms(160样点)总帧数:45-1. Corpus right to set its estimated Pitch. Asked to use MATLAB the pitch detection algorithm, and
sports_veronicasun
- 1998年1月份人民日报语料中体育类文章的识别,C语言-January 1998 Corpus People's Daily Sports article identification, C Language
SegAndPosTools
- 实现语料的分割,和特征值的提取,还有bayes分类器-achieve Corpus segmentation, and eigenvalue extraction, and bayes classifier
Kappa
- 用于计算人工标注语料时,不同标注者之间的共同认知程度的Kappa值计算算法-used in the calculation of artificial tagging corpus, between different tagging common understanding of the extent of the Kappa values Algorithm
tagging
- nlp 用隐马可夫实现语料标记,并对结果进行测试
AssignMSRAWSInfo
- 为msra语料加入标记信息,以便进行后续处理,文件中有标注前和标注后的例子,很容易看懂
CRF++-0.50
- CRF++ 5.0的 source 应用在自然语言识别等领域的机器训练,对2G以上的语料不会出现内存溢出等问题
Form2-26
- 从已标注的语料库中提取数据,转存在EXCEL中
countword
- 可以自动读取文章,并对其中的高频词进行统计,最终获得某类相关文章的语料库
svmcls
- 基于SVM的文本分类算法,有自己的语料库
supervisedWSD
- 利用贝叶斯分类原理实现多义词的消歧。首先利用训练语料进行训练,然后基于机器已经获取的知识的基础上对生语料进行词义标注。
TextClassification
- 帮师姐做的毕业论文:基于朴素贝叶斯的文本分类器,使用Visual C# 2005编写,文本语料库包括测试语料库和训练语料库(保存再Access数据库中)
ReadDir
- 该程序实现的是一个垃圾邮件过滤系统,方法采用的是NAIVE Bayes,语料库用的是LINspam—public,程序中有使用说明,希望大家一起探讨改进一下,
SogouC.mini.20061127
- 文本分类现成语料库,是SogouC.mini.20061127.zip格式的,可用于web数据挖掘
quanwenjiansuo
- 全文检索程序,最长匹配,可以立刻找到所有出现的句子,需要语料库,(例如人民日报)。-text retrieval procedures, the longest match, can immediately find all the sentences need to Corpus (for example, the People's Daily).
SVM分类器
- SVM文本分类器源程序,英文界面,包含语料,没有解压缩密码-SVM text classifier source, English interface, including Corpus, not extract passwords
liqingyun_paper
- 一篇关于“现代汉语标注语料,树库文档转换成XML文档”的论文。 论文主要做了以下三个工作: 1. 对于汉语语料库的文本文档,进行转换,生成XML文档。 2. 对于符合树库标准的文档,进行转换,生成XML文档。 3. 将XML文档,根据DOM标准,以树形显示在屏幕上。-one of the "Modern Chinese Corpus tagging trees for documents converted into XML documents," the papers. P
TestCorpus
- 这个对vc的初学者很有帮助哦,简单的语料库管理工具。-the right vc beginners helpful Oh, the simple Corpus management tool.