搜索资源列表
jiyinjiance
- 基音检测: 对给定语料估计其基音周期。 要求用MATLAB或C语言实现有关基音检测算法,并给出检测结果与实验报告 实验语料:MaoYiSheng.raw 发音:“茅以升”;时长0.9s;采样率:8kHz;量化精度为16bits/sample;数据格式 LSB,MSB 分析帧长:20ms(160样点) 总帧数:45-Pitch Detection: For a given corpus to estimate the pitch period. Require MAT
qwvvfg
- 基于语料库的中文姓名识别方法研究 本文在大规模语料基础上提取和分析了中文姓氏和名字用字的使用频率,研究了 中文姓名识别的评价函数,动态地建立了姓名识别统计数据表和姓名阅值-Corpus-based Study of Chinese Names Recognition Based on the large-scale extraction and analysis of corpus based on the first and last name in Chinese character
Collection-and-Analysis
- 本文首先在欧共体项目(LC-STAR)的资助下,开展了大规模汉语平衡语料的收集与分析工作,其主要目的是建立一个反映现代汉语语言特点的、适用于汉语语言分析、语音识别和语音合成的汉语标注语料库,并以此为基础建立相应的信息词典。-Our work supported by European Union’s project of LC-STAR, which includes collection and analysis of a large-scale balance-corpus, aims to
199801
- 人民日报1998年1月份的标注语料库,本人觉得很好所以共享一下~ 研究自然语言的朋友应该会用到~-People s Daily of January 1998 marked corpus of natural language should be used- friends
wordsimilar
- 词汇分类 相似度计算 文本语料分析 归类 知网数据分类-Word text corpus classification Similarity analysis of data classified Text Classification
20117230242204
- 有关语料处理的代码,包括简单分词,语法树分析 -The corpus processing code, including a simple word, syntax tree analysis
Retrieval
- 文本检索,MFC界面,对语料库进行检索,输出带有关键字的语句-Text retrieval, MFC interface, the corpus search, output of statement with the keyword
mm
- 通过与训练语料库中进行比对,对指定文本进行前向分词与后向分词。训练语料库为人民日报1998年1月的文章,训练语料是已经分好词的-fmm and bmm cut words
cilinciku
- 同义词词林的mdb格式汉语词库,作为语义分析的语料库使用-The synonyms Cilin mdb format Chinese Word
yuliao199801
- 人民日报标注语料1998年1月份,语义分析的实用的语料库-People s Daily corpus of label in January 1998, semantic analysis, practical corpus
geniuswiki
- 语料库管理系统功能齐全而强大,知识面广而且使用课程实际使用的毕业设计-Corpus management system has complete function and strong, broad knowledge and the use of the actual use of the graduate design course
20news-bydate.tar
- 一个可用的英文语料库,包含20大分类,可用作文本分类语料库-One of the available English corpus, including 20 big classification, usable ZuoWenBen corpus
TextClassify-KNN-SVM
- 根据语料库对文本进行分类,有界面,KNN、贝叶斯方法-According to the corpus, text classification KNN, bayesian
AIML
- AIML 人工智能,可以与人类交流,但需要大量的语料.-AIML robot ,can communicaton
Kernel-for-Relation-Extraction
- 最短的路径依赖关系提取 我们提出了一个新颖的方法来提取关系,根据观察断言之间的关系之间的两个命名实体在同一个句子1所需的信息通常是由两个实体之间的依赖关系图中的最短路径捕获。实验上提取的ACE(自动内容抽取)报纸语料表明,新的最短路径依赖内核外执行最近的做法,根据去依赖树内核顶层的关系-We present a novel approach to relation extraction, based on the observation that the information requir
ScriptProject
- 将现有的的文章利用语料库中的词语将其分分割成不同词语就可以断开,还包含界面-segment the essay use the direction existed
yuliaoku
- 是一个很好 语料库,可以用来进行训练分类器。如果使用,是一个很好的选择,适合新手学习。-Is a good corpus, can be used to train the classifier. If you are using is a good choice for novice learning.
master_thesis
- 音乐领域中文实体关系抽取研究 实体关系抽取的任务是从文本中抽取出两个或者多个实体之间预先定义 好的语义关系。本文将实体关系抽取定义为一个分类问题,主要研究内容是 中文音乐领域的实体关系抽取。针对这一问题,本文首先构建了中文音乐实 体关系语料库,然后分别采用了基于序列模式挖掘的无指导的方法和基于特 征提取的有指导的方法来解决这一问题。 -Dissertation for the Master Degree in Engineering urgently needed to de
onTextCategorization
- 本文比较研究了在中文文本分类中特征选取方法对分类效果的影响。考察了文档频率DF、信息增 益IG、互信息MI、V2分布CHI 四种不同的特征选取方法。采用支持向量机(SVM) 和KNN两种不同的分类 器以考察不同抽取方法的有效性。实验结果表明, 在英文文本分类中表现良好的特征抽取方法( IG、MI 和 CHI)在不加修正的情况下并不适合中文文本分类。文中从理论上分析了产生差异的原因, 并分析了可能的 矫正方法包括采用超大规模训练语料和采用组合的特征抽取方法。最后通过实验验证组合特征
som_antconc_results
- 聚类是对数据对象进行划分的一种过程,与分类不同的是,它所划分的类是未知的,这是一个“无指导的学习” 过程,本文件采用基于MATLAB GUI 编写了SOM的神经网络语料聚类分析-Corpus clustering of the SOM-based neural network analysis