搜索资源列表
clcl
- 关于语音识别中语料库的建立与整理,以及分析统计-Speech Recognition Corpus on the establishment and finishing, as well as the analysis of statistical
bigram1
- 根据从语料库中统计出的词表建立二元文法法语言模型-According to statistics from the corpus vocabulary out of the establishment of the dual language model grammar France
MM2
- 利用隐马尔可夫模型实现词性标注。此为无监督模型。 内含语料库和测试集。方便大家学习。--Transition Matrix and Emission Matrix of Hidden Markov Model
java-text-classter-tool
- Java 实现的文本分类工具,包含语料库和实例代码。-Java implementation of text classification tools, including the corpus and the example code.
VoxForge
- 高级语音识别语料库,英语专用,HTK必备资料-Advanced speech recognition corpus, English dedicated, HTK essential information
1
- 基于WEKA平台的文本聚类研究与实现 文本聚类是文本挖掘领域的一个重要研究分支,是聚类方法在文本处理领域的应用。本文对基于空间向量模型的文本聚类过程做了较深入的讨论和总结,利用文本语料库,基于数据挖掘工具研究并实现了文本聚类的过程。本文首先给出了文本聚类的思想和过程,回顾了文本聚类领域的已有成果,列举了文本聚类领域在特征表示、特征提取等方面的基础研究工作。另外,本文回顾了现有的文本聚类算法,以及常用的文本聚类效果评价指标。在研究了已有成果的基础上,本文利用20 Newsgroup文本语料库,
WekaTest
- weka包+eclipse完成中文语料库分词 分类-weka package+ eclipse complete classification of Chinese word segmentation corpus
qwvvfg
- 基于语料库的中文姓名识别方法研究 本文在大规模语料基础上提取和分析了中文姓氏和名字用字的使用频率,研究了 中文姓名识别的评价函数,动态地建立了姓名识别统计数据表和姓名阅值-Corpus-based Study of Chinese Names Recognition Based on the large-scale extraction and analysis of corpus based on the first and last name in Chinese character
Collection-and-Analysis
- 本文首先在欧共体项目(LC-STAR)的资助下,开展了大规模汉语平衡语料的收集与分析工作,其主要目的是建立一个反映现代汉语语言特点的、适用于汉语语言分析、语音识别和语音合成的汉语标注语料库,并以此为基础建立相应的信息词典。-Our work supported by European Union’s project of LC-STAR, which includes collection and analysis of a large-scale balance-corpus, aims to
199801
- 人民日报1998年1月份的标注语料库,本人觉得很好所以共享一下~ 研究自然语言的朋友应该会用到~-People s Daily of January 1998 marked corpus of natural language should be used- friends
Retrieval
- 文本检索,MFC界面,对语料库进行检索,输出带有关键字的语句-Text retrieval, MFC interface, the corpus search, output of statement with the keyword
mm
- 通过与训练语料库中进行比对,对指定文本进行前向分词与后向分词。训练语料库为人民日报1998年1月的文章,训练语料是已经分好词的-fmm and bmm cut words
cilinciku
- 同义词词林的mdb格式汉语词库,作为语义分析的语料库使用-The synonyms Cilin mdb format Chinese Word
yuliao199801
- 人民日报标注语料1998年1月份,语义分析的实用的语料库-People s Daily corpus of label in January 1998, semantic analysis, practical corpus
geniuswiki
- 语料库管理系统功能齐全而强大,知识面广而且使用课程实际使用的毕业设计-Corpus management system has complete function and strong, broad knowledge and the use of the actual use of the graduate design course
20news-bydate.tar
- 一个可用的英文语料库,包含20大分类,可用作文本分类语料库-One of the available English corpus, including 20 big classification, usable ZuoWenBen corpus
TextClassify-KNN-SVM
- 根据语料库对文本进行分类,有界面,KNN、贝叶斯方法-According to the corpus, text classification KNN, bayesian
ScriptProject
- 将现有的的文章利用语料库中的词语将其分分割成不同词语就可以断开,还包含界面-segment the essay use the direction existed
yuliaoku
- 是一个很好 语料库,可以用来进行训练分类器。如果使用,是一个很好的选择,适合新手学习。-Is a good corpus, can be used to train the classifier. If you are using is a good choice for novice learning.
master_thesis
- 音乐领域中文实体关系抽取研究 实体关系抽取的任务是从文本中抽取出两个或者多个实体之间预先定义 好的语义关系。本文将实体关系抽取定义为一个分类问题,主要研究内容是 中文音乐领域的实体关系抽取。针对这一问题,本文首先构建了中文音乐实 体关系语料库,然后分别采用了基于序列模式挖掘的无指导的方法和基于特 征提取的有指导的方法来解决这一问题。 -Dissertation for the Master Degree in Engineering urgently needed to de