搜索资源列表
bayes-network-for-classication
- 利用朴素贝叶斯网络来训练语料库,得到理想模型-bayes network for classication
Bible_corpus
- 中英文圣经的全文语料库,供自然语言处理用的宝贵资料-The full text of the Bible in English corpus for natural language processing valuable information
wordsimilar
- 词汇分类 相似度计算 文本语料分析 归类 知网数据分类-Word text corpus classification Similarity analysis of data classified Text Classification
wordsimilar
- 词汇分类 相似度计算 文本语料分析 归类 知网数据分类-Word text corpus classification Similarity analysis of data classified Text Classification
CorpusStatistic
- 语料字、词和短语统计,实现不同格式语料的转换-Statistic Corpus
NLPIR-JNI
- 这是张华平博士发布NLPIR汉语分词系统(又名ICTCLAS2013).可用于对语料进行分词,预处理.-ictclass word split
p(s)
- 这个程序比较两个句子在语料中出现概率的大小-Compare two sentences in the size of the corpus probability
ygrx
- 这是一个简单的中文分词程序,可以在没有语料库的情况下通过各个词语的相关度将中文词汇抽取出来-A simple Chinese segmentation procedures, speed is also good
libsvm实现文本分类源程序
- libsvm实现文本分类源序,其中: 1.0Beta ,是打包好的可执行的jar文件,运行前需要配置一下,具体看目录下的README.TXT; 程序工程,是源代码,不过并不是和1.0Beta里面的完全一致; 实验样例,用来进行试运行的文本文件; 语料库,包含了3000多份文档的语料库,用"抽取"将在单个文档中的多个类型的文本提取到ouput目录下
SogouC.reduced.20061102.tar
- 搜狗语料库,用于文本分类 数据挖掘 机器学习里面非常有用-Sogou corpus for text classification data mining machine learning which is very useful
mongolian
- 蒙古文unicode编码语料,可用于蒙古文编码查看、以及后续一些研究使用,规模较小。-Mongolian unicode encoded corpus can be used to encode view Mongolian, and follow some of the studies used a smaller scale.
sckr2013_final
- 基于Word2vec的词语相似度计算,包含完整的java代码,但语料由Word2vec训练得到的模型太大,故不附带模型。-Word2vec-based word similarity computation, including complete java code, but by the Word2vec training corpus resulting model is too large, it is not included with model.
msra
- 命名实体识别语料,有训练语料,测试语料,测试语料对应的黄金语料-NER corpus, there are training corpus, test corpus, the corresponding test corpus corpus gold
program
- 中文分词程序,使用的是1998年的人民日报语料进行的处理,有做相同研究的可以下载使用-Chinese word segmentation program
hmmalign-master
- 双语对齐,用于基于记忆的辅助翻译中,可对双语语料进行自动对齐处理-hmmalign for the language align
automatic-word-segmentation
- 实现一个中文自动分词程序,所使用的编程语言不限 选作:对人名,地名,机构名的识别 下载北大计算语言所标注的99年人民日报分词语料库,构建一个词表 实现正向、逆向最大分词算法-To implement a Chinese automatic word segmentation procedure, used by any programming language Chosen for: the person names, place names, organization name
natural-language-processing
- 统计自然语言处理PPT-刘挺 中科院自动化研究所、模式识别国家重点实验室的 介绍的内容有统计机器翻译、词法分析与词性标注、语料库与词汇知识库-Statistical Natural Language Processing PPT-Ting Liu Institute of Automation, Chinese Academy of Sciences, State Key Laboratory of Pattern Recognition content presentation of
123123DTW
- 用Matlab实现DTW孤立词识别算法,包含代码语料-Voice recognition algorithm DTW
natural-language-understanding
- 中文分词、自然语言理解、机器学习及语料切分,完整的工程报告。-Chinese word segmentation Natural language understanding of machine learning and data segmentation, a complete project report
echo
- speex中的回声消除程序,可以直接在vs下运行,效果还行,有测试语料-Speex of echo cancellation procedures, can be directly run under vs, results are ok, have a test corpus