搜索资源列表
testRead
- 这是一个关于语料库文本采集整理的软件源码,通过它可以规范文本格式-This is a text collection of Corpus collate source software, it can regulate text format
复件 语料库试验程序
- 处理语料库信息的小程序-Corpus information handling procedures small
jiyusimfenlei
- 基于SVM的文档分类,运行平台:Visual C++ 6.0和基于libsvm的编程环境下,应用Reuters-21578语料库对系统进行评测。-SVM-based document classification, operating platforms : 6.0 and Visual C libsvm-based programming environment, Application Reuters-21578 Corpus evaluation of the system.
countword
- 可以自动读取文章,并对其中的高频词进行统计,最终获得某类相关文章的语料库
TextClassification
- 帮师姐做的毕业论文:基于朴素贝叶斯的文本分类器,使用Visual C# 2005编写,文本语料库包括测试语料库和训练语料库(保存再Access数据库中)
SogouC.mini.20061127
- 文本分类现成语料库,是SogouC.mini.20061127.zip格式的,可用于web数据挖掘
TestCorpus
- 这个对vc的初学者很有帮助哦,简单的语料库管理工具。-the right vc beginners helpful Oh, the simple Corpus management tool.
AutoChatting.rar
- 用AIML语言开发的一款中文自动聊天软件,附加有部分AIML中文对话语料库,AIML language developed by a Chinese auto-chat software, additional dialogue, some Chinese Corpus AIML
GBK_pinyin_table
- GBK拼音字表,含有32026个汉字,还包括词频,是开发输入法的绝佳语料库-GBK pinyin table 32026
PoS-Tagging-based-on-HMM
- 基于隐马尔科夫的中文词性标注系统的C++源代码,包括训练集和测试集语料库,单词量和词性数目都没有写死,可适应任意大的训练和测试数据集,程序已经过优化,一次标注只需要不到10秒的时间。-Based on Hidden Markov of the Chinese part of speech tagging system in C++ source code, including the training set and test set corpus, vocabulary and speech
yuliaoku
- 对语料库的一些文献和资料集合,有一定的参考价值-Some of the corpus of literature and information collection, has some reference value
reuters21578
- 这是一个英文的语料库,可以用于进行文本的分类与聚类。是文本分类领域共用的一个语料库。-This is a corpus of English, can be used for text classification and clustering. The field of text classification is a common corpus.
tc-corpus-train
- 语料库训练集 , 适用于文本分类中的训练-ts-corpus-training
bigram1
- 根据从语料库中统计出的词表建立二元文法法语言模型-According to statistics from the corpus vocabulary out of the establishment of the dual language model grammar France
corpus
- 语料库,蒙语同音同形词管理与维护工具。c++builder + access结合的产品。算法经典-corpus
MM2
- 利用隐马尔可夫模型实现词性标注。此为无监督模型。 内含语料库和测试集。方便大家学习。--Transition Matrix and Emission Matrix of Hidden Markov Model
tc-corpus-answer
- 语料库训练集 , 适用于文本分类中的训练(Corpus training set for training in text classification)
CorpusWordParser
- 语料分词和词性标注软件。 软件只支持打开文本格式(.txt)的文件,其他类型文件需先另存为文本文件格式后再处理。 软件可以自动识别、处理文本文件的不同字符编码(GB或Unicode等)。(Word segmentation and part of speech tagging software. Software only supports files that open text format (.Txt), and other types of files need to be sav
语料库检索工具
- 一个语料库检索工具,可以对文本形式的英汉词典(包含常用英文词汇)进行检索,是开发大型语料库工具的原型(the assistance of statistical package and computer programs)