搜索资源 - 语料 - 搜珍网

CDN加速镜像 | 设为首页 | 加入收藏夹

热门搜索： 源码 Android 整站插件识别 p2p OpenCV 网络编程游戏源码算法更多...

登陆 | 会员注册

当前位置：

搜索资源 - 语料

下载资源主分类

源码下载

Web源码

开发工具

文档下载

其它资源

资源分类

Linux/Unix编程

弱点检测代码

扫描程序

加密解密

CA认证

Linux驱动

搜索资源列表

GIZA++.2003-09-30.tar

0下载：
GIZA++是德国Och提供的针对统计机器翻译模型的训练工具集。这个工具可以生成IBM统计翻译模型的第4和第5种模型，采用两种方向的训练（比如对同一个语料，从中文到英文和从英文到中文的训练），再配以适当的编码，可以提取出适合基于Phrase的统计机器翻译phrase table来，为后续的工作提供数据支持。
所属分类：Linux/Unix编程
- 发布日期：2013-03-28
- 文件大小：108095
- 提供者：王天庆

CorpusDemo.exe

0下载：
这是一个语料库查询系统，可以学习一下VC的文件操作和管理平台建设-This is a Corpus inquiry system, we can learn from what the VC operation and document management platform
所属分类：系统编程
- 发布日期：2008-10-13
- 文件大小：229723
- 提供者：国誉

Qwickconcordance-1.0

1下载：
这是一个语料库检索的程序，可以学习一下CONCORDANCE以及它的实现-This is a Corpus retrieval procedures can learn about CONCORDANCE and its realization
所属分类：系统编程
- 发布日期：2008-10-13
- 文件大小：417652
- 提供者：国誉

tongyc

0下载：
自然语言信息处理的语料库，非常好的测试语料-natural language information processing Corpus, very good testing corpus
所属分类：Linux/Unix编程
- 发布日期：2008-10-13
- 文件大小：323884
- 提供者：侯风巍

word-segment-tool-for-chinese

0下载：
基于北大语料库的分词器，简单，有使用说明-a chinese word segment tool
所属分类：Linux-Unix program
- 发布日期：2017-03-24
- 文件大小：617639
- 提供者：witfox

lda-c

0下载：
LDA是一种文档主题生成模型，也称为一个三层贝叶斯概率模型，包含词、主题和文档三层结构。文档到主题服从Dirichlet分布，主题到词服从多项式分布。 LDA是一种非监督机器学习技术，可以用来识别大规模文档集（document collection）或语料库（corpus）中潜藏的主题信息。它采用了词袋（bag of words）的方法，这种方法将每一篇文档视为一个词频向量，从而将文本信息转化为了易于建模的数字信息。但是词袋方法没有考虑词与词之间的顺序，这简化了问题的复杂性，同时也为
所属分类：Driver develop
- 发布日期：2017-04-16
- 文件大小：30689
- 提供者：yangling

Encrypt

0下载：
单字母加密，基于特征值，英语语料库（词汇量7万左右）-Single letter encryption, based on the characteristic values of English corpus (vocabulary 70000 or so)
所属分类：CA program
- 发布日期：2017-04-29
- 文件大小：356478
- 提供者：wayne

搜珍网 www.dssz.com

本网站为编程资源及源代码搜集、介绍的搜索网站，版权归原作者所有！　　粤ICP备11031372号

1999-2046 搜珍网 All Rights Reserved.