搜索资源列表
语音合成语料库管理系统的研究与设计
- 本文主要叙述了语料及其管理系统的研究与设计用最新的开发工具和现有软件达到系统的设计 目标-This paper describes the corpus and its management system research and design using the latest development tools and existing software system to achieve the design goal
v.206(预处理)
- lex语法分析,对BNC语料库进行文本标注前的预处理,将与SGML标注与文本词性标注无关的删除掉-this is lex syntax analyzing,annotate with BNC syntax LIB.
CJCorpus
- 一个日汉平行的双语语料库,含有4053个句子-a parallel to the Japanese and Chinese bilingual corpus, containing 4,053 Sentence
wenbenfenlei
- 中文文本分类的语料库,比较全面,可用于进行分类训练时-Chinese text classification of Corpus, more comprehensive, and can be used for classification of training
testRead
- 这是一个关于语料库文本采集整理的软件源码,通过它可以规范文本格式-This is a text collection of Corpus collate source software, it can regulate text format
CorpusDemo.exe
- 这是一个语料库查询系统,可以学习一下VC的文件操作和管理平台建设-This is a Corpus inquiry system, we can learn from what the VC operation and document management platform
Qwickconcordance-1.0
- 这是一个语料库检索的程序,可以学习一下CONCORDANCE以及它的实现-This is a Corpus retrieval procedures can learn about CONCORDANCE and its realization
TestCorpusyuliaoguanli
- 1. 这是一个简单的语料库管理系统 2. 可以添加和删除语料文件,统计语料中的字数 3. 可以查找语料中的汉字串以及重叠形式 4. 语料文件存放在corpus目录下,查询结果保存在跟语料库相同目录下 5. corpus目录下有4个文本文件(其中test1, test2是两个小文件)供测试用 6. 只能处理文本文件,GB内码-1. This is a simple Corpus management system 2. They can add and delete corpu
tongyc
- 自然语言信息处理的语料库,非常好的测试语料-natural language information processing Corpus, very good testing corpus
jiyusimfenlei
- 基于SVM的文档分类,运行平台:Visual C++ 6.0和基于libsvm的编程环境下,应用Reuters-21578语料库对系统进行评测。-SVM-based document classification, operating platforms : 6.0 and Visual C libsvm-based programming environment, Application Reuters-21578 Corpus evaluation of the system.
Wordsegmentation2
- NLP技术实现,对语料库进行自动统计生成分词词典,对训练集进行分词,列出所有的分词可能并计算每种可能的概率。请使用者自行加入语料库和测试集。-NLP technology to automatically Corpus Health Statistics ingredients dictionary, the training set for segmentation, list all the sub-term may calculate the probability of each pos
SogouW.20061127
- 互联网词库来自于对SOGOU搜索引擎所索引到的中文互联网语料的统计分析,统计所进行的时间是2006年10月,涉及到的互联网语料规模在1亿页面以上。统计出的词条数约为15万条高频词,除标出这部分词条的词频信息之外,还标出了常用的词性信息。 语料库统计的意义:反映了互联网中文语言环境中的词频、词性情况。 应用案例:中文词性标注、词频分析等。 词性分类: N 名词 V 动词 ADJ 形容词 ADV 副词 CLAS 量词 ECHO 拟声词
yulao.SogouT.min
- soguo公司的语料,用于文本,网页分类,很好的语料库。
Form2-26
- 从已标注的语料库中提取数据,转存在EXCEL中
countword
- 可以自动读取文章,并对其中的高频词进行统计,最终获得某类相关文章的语料库
svmcls
- 基于SVM的文本分类算法,有自己的语料库
TextClassification
- 帮师姐做的毕业论文:基于朴素贝叶斯的文本分类器,使用Visual C# 2005编写,文本语料库包括测试语料库和训练语料库(保存再Access数据库中)
tc-corpus-answer
- 语料库训练集 , 适用于文本分类中的训练(Corpus training set for training in text classification)
CorpusWordParser
- 语料分词和词性标注软件。 软件只支持打开文本格式(.txt)的文件,其他类型文件需先另存为文本文件格式后再处理。 软件可以自动识别、处理文本文件的不同字符编码(GB或Unicode等)。(Word segmentation and part of speech tagging software. Software only supports files that open text format (.Txt), and other types of files need to be sav