搜索资源 - 语料库 - 搜珍网

CDN加速镜像 | 设为首页 | 加入收藏夹

热门搜索： 源码 Android 整站插件识别 p2p OpenCV 网络编程游戏源码算法更多...

登陆 | 会员注册

当前位置：

搜索资源 - 语料库

下载资源主分类

源码下载

Web源码

开发工具

文档下载

其它资源

资源分类

搜索资源列表

TIMIT

1下载：
TIMIT的一部分语料库，不是很全，刚从网上下载的希望对大家有所帮助-Part of the corpus of TIMIT, not very full, just downloaded we want to be helpful.
所属分类：语音合成与识别
- 发布日期：2013-12-14
- 文件大小：9192088
- 提供者：zhao

AIMLTest

0下载：
此程序采用AIML实现机器对话，当你问问题的时候，他会做做相应的回答。文件里面包含以下简单的语料库进行测试，如果做对话的可以了解下。-This program uses AIML machine dialogue, when you ask questions, he will be doing the appropriate answer. File which contains the following simple corpus for testing, if the dialogue
所属分类：AI-NN-PR
- 发布日期：2017-11-13
- 文件大小：10246144
- 提供者：huangzhong

pfr199801

0下载：
PFR人民日报标注语料库(版本1.0，下面简称PFR语料库)是在得到人民日报社新闻信息中心许可的条件下，以1998年人民日报语料为对象，由北京大学计算语言学研究所和富士通研究开发中心有限公司共同制作的标注语料库。为了促进中文信息处理研究的发展，我们三方计划公开PFR语料库。作为公开的前期工作，从4月3日起，在我们三方的主页上免费公开PFR语料库1月份的语料，欢迎大家下载。PFR语料库的制作规范参阅《现代汉语语料库加工――词语切分与词性标注规范》。如果您在研究或论文工作中使用PFR语料库，请注明来
所属分类：MultiLanguage
- 发布日期：2017-11-05
- 文件大小：2216152
- 提供者：icypriest

segment

0下载：
用最大匹配法对汉语进行自动分词 seg.py 分词的实现 accuracy.py 分词性能评估 PD_1998_01_POS.txt ”人民日报“语料库-Automatically the word seg.py segmentation achieve maximum matching of Chinese accuracy.py word performance assessment PD_1998_01_POS.txt " People' s Daily"
所属分类：Other systems
- 发布日期：2017-11-16
- 文件大小：2825399
- 提供者：高圆圆

pos_tag

1下载：
用viterbi方法进行词性标注 pos_tag.py 词性标注 evaluate.py 词性标注性能评估 PD_1998_01_POS.txt ”人民日报“语料库标准词性标注结果.txt 语料库中后10 的数库（分词+词性标注）-Using the viterbi methods for part-of-speech tagging pos_tag.py part-of-speech tagging the evaluate.py speech tagging perform
所属分类：Other systems
- 发布日期：2016-10-07
- 文件大小：3090432
- 提供者：高圆圆

fenci

0下载：
利用HMM，针对《1998年人民日报》语料库进行研究，最终实现了中文语句的自动分词-By HMM, research, and ultimately the Chinese statement for the 1998 People' s Daily " Corpus automatic segmentation
所属分类：CSharp
- 发布日期：2017-11-20
- 文件大小：4230586
- 提供者：txd

pu1

3下载：
用于机器学习中垃圾邮件过滤的垃圾邮件语料库-For machine learning in spam filtering spam corpus
所属分类：AI-NN-PR
- 发布日期：2017-11-19
- 文件大小：1423024
- 提供者：

computer-voice-input

0下载：
将语音录入问题分为三个模块进行研究：语音识别模块、字转换模块和语料库建立模块。-Voice recording is divided into three modules for research: speech recognition module, word conversion module and corpus creation module.
所属分类：software engineering
- 发布日期：2017-11-14
- 文件大小：3282610
- 提供者：lhj

Speech-Corpus

0下载：
声语音连续语音语料库，包含用于语音识别培训和测试的数据-Voiced speech continuous speech corpus, contains the data for the voice recognition training and testing
所属分类：Speech/Voice recognition/combine
- 发布日期：2017-11-11
- 文件大小：8136589
- 提供者：zhangxin

TFIDF

0下载：
语料库中计算tfidf的值。java开发完成。-Corpus tfidf calculated value. java development is completed.
所属分类：Java Develop
- 发布日期：2017-11-19
- 文件大小：1697
- 提供者：qfxu

bayes-network-for-classication

0下载：
利用朴素贝叶斯网络来训练语料库，得到理想模型-bayes network for classication
所属分类：matlab
- 发布日期：2017-11-11
- 文件大小：201860
- 提供者：李婷会

Bible_corpus

0下载：
中英文圣经的全文语料库，供自然语言处理用的宝贵资料-The full text of the Bible in English corpus for natural language processing valuable information
所属分类：MultiLanguage
- 发布日期：2017-05-11
- 文件大小：2906757
- 提供者：yzheng

ygrx

0下载：
这是一个简单的中文分词程序，可以在没有语料库的情况下通过各个词语的相关度将中文词汇抽取出来-A simple Chinese segmentation procedures, speed is also good
所属分类：Other systems
- 发布日期：2017-04-14
- 文件大小：4818
- 提供者：denisdou

libsvm实现文本分类源程序

0下载：
libsvm实现文本分类源序,其中： 1.0Beta ，是打包好的可执行的jar文件，运行前需要配置一下，具体看目录下的README.TXT；程序工程，是源代码，不过并不是和1.0Beta里面的完全一致；实验样例，用来进行试运行的文本文件；语料库，包含了3000多份文档的语料库，用"抽取"将在单个文档中的多个类型的文本提取到ouput目录下
所属分类：Windows编程
- 发布日期：2013-12-06
- 文件大小：31283361
- 提供者：25_hua

SogouC.reduced.20061102.tar

3下载：
搜狗语料库，用于文本分类数据挖掘机器学习里面非常有用-Sogou corpus for text classification data mining machine learning which is very useful
所属分类：Other systems
- 发布日期：2017-06-16
- 文件大小：24368795
- 提供者：张杰

automatic-word-segmentation

0下载：
实现一个中文自动分词程序，所使用的编程语言不限选作：对人名，地名，机构名的识别下载北大计算语言所标注的99年人民日报分词语料库，构建一个词表实现正向、逆向最大分词算法-To implement a Chinese automatic word segmentation procedure, used by any programming language Chosen for: the person names, place names, organization name
所属分类：Compress-Decompress algrithms
- 发布日期：2017-04-03
- 文件大小：426197
- 提供者：黄艳玲

natural-language-processing

0下载：
统计自然语言处理PPT-刘挺中科院自动化研究所、模式识别国家重点实验室的介绍的内容有统计机器翻译、词法分析与词性标注、语料库与词汇知识库-Statistical Natural Language Processing PPT-Ting Liu Institute of Automation, Chinese Academy of Sciences, State Key Laboratory of Pattern Recognition content presentation of
所属分类：AI-NN-PR
- 发布日期：2017-05-14
- 文件大小：3483007
- 提供者：吴鹏

lda-c

0下载：
LDA是一种文档主题生成模型，也称为一个三层贝叶斯概率模型，包含词、主题和文档三层结构。文档到主题服从Dirichlet分布，主题到词服从多项式分布。 LDA是一种非监督机器学习技术，可以用来识别大规模文档集（document collection）或语料库（corpus）中潜藏的主题信息。它采用了词袋（bag of words）的方法，这种方法将每一篇文档视为一个词频向量，从而将文本信息转化为了易于建模的数字信息。但是词袋方法没有考虑词与词之间的顺序，这简化了问题的复杂性，同时也为
所属分类：Driver develop
- 发布日期：2017-04-16
- 文件大小：30689
- 提供者：yangling

616341

0下载：
中文文本语料库适合中文文本分类使用朴素贝叶斯算法整合 -Chinese text categorization corpus
所属分类：Project Manage
- 发布日期：2017-04-29
- 文件大小：88782
- 提供者：Sirius GY

CoupletSystem

0下载：
对联系统 C++ 实现语料库中的对联效果比较好-Couplet system c++
所属分类：Other windows programs
- 发布日期：2017-05-26
- 文件大小：8758672
- 提供者：katrina

« 1 2 3 4 56 7 »

搜珍网 www.dssz.com

本网站为编程资源及源代码搜集、介绍的搜索网站，版权归原作者所有！　　粤ICP备11031372号

1999-2046 搜珍网 All Rights Reserved.