CDN加速镜像 | 设为首页 | 加入收藏夹
当前位置: 首页 资源下载 文档资料 软件工程 搜索资源 - 语料

搜索资源列表

  1. yulao.SogouT.min

    0下载:
  2. soguo公司的语料,用于文本,网页分类,很好的语料库。
  3. 所属分类:软件工程

    • 发布日期:2008-10-13
    • 文件大小:865268
    • 提供者:马龙
  1. LJClusterDemo

    0下载:
  2. 文本聚类是基于相似性算法的自动聚类技术,自动对大量无类别的文档进行归类,把内容相近的文档归为一类,并自动为该类生成特征主题词。适用于自动生成热点舆论专题、重大新闻事件追踪、情报的可视化分析等诸多应用。 灵玖Lingjoin(www.lingjoin.com)基于核心特征发现技术,突破了传统聚类方法空间消耗大,处理时间长的瓶颈;不仅聚类速度快,而且准确率高,内存消耗小,特别适合于超大规模的语料聚类和短文本的语料聚类。 灵玖文档聚类组件的主要特色在于: 1、速度快:可以处理海量规模
  3. 所属分类:software engineering

    • 发布日期:2017-04-10
    • 文件大小:1100725
    • 提供者:lingjoin
  1. Collection-and-Analysis

    0下载:
  2. 本文首先在欧共体项目(LC-STAR)的资助下,开展了大规模汉语平衡语料的收集与分析工作,其主要目的是建立一个反映现代汉语语言特点的、适用于汉语语言分析、语音识别和语音合成的汉语标注语料库,并以此为基础建立相应的信息词典。-Our work supported by European Union’s project of LC-STAR, which includes collection and analysis of a large-scale balance-corpus, aims to
  3. 所属分类:software engineering

    • 发布日期:2017-03-29
    • 文件大小:260197
    • 提供者:叶眸
  1. computer-voice-input

    0下载:
  2. 将语音录入问题分为三个模块进行研究:语音识别模块、 字转换模块和语料库建立模块。-Voice recording is divided into three modules for research: speech recognition module, word conversion module and corpus creation module.
  3. 所属分类:software engineering

    • 发布日期:2017-11-14
    • 文件大小:3282610
    • 提供者:lhj
  1. PMl-IR

    0下载:
  2. Blog信息源和信息量的广泛增长给中文文本分类带来了新的挑战。本文提出了—种基于PMI—IR算法的四种情感分类方法来对Blog文本进行情感分类。该方法以情感词语为中心,通过搜索引擎返回的结果来计算文本 中的情感要素和背景情感词之问的点互信息值,从而对文本进行情感分类。该方法在国家语言资源监测与研究中心网络媒体语言分中-心2008年度的Blog语料和COAE2008的语料上分别进行了测试。与传统方法相比准确率和召回率都有了较大的提高。-Development ofBIog texts info
  3. 所属分类:software engineering

    • 发布日期:2017-05-03
    • 文件大小:677334
    • 提供者:guwei
  1. word2vec

    0下载:
  2. word2vec:谷歌的开源项目,实现从词语到向量的转换(word to vector),Linux系统下运行,需要较大规模的语料资源用作训练才能体现出很好的效果(中英文均可),并且可以实现测量两个词语之间的距离(cos值表示),词语聚类等。-word2vec: Google' s open-source projects, a word-to-vector conversion (word to vector) running under Linux system, requires
  3. 所属分类:software engineering

    • 发布日期:2017-03-29
    • 文件大小:113327
    • 提供者:sherlydunn
  1. RDF3X-a-RISCstyle

    0下载:
  2. RDF是为了模式自由的信息提供的一种数据表达方式,在语义网语料库、生命科学、web2.0平台上发展迅速。-RDF is a data in order to model the freedom of expression of information provided by the rapid development of the Semantic Web corpora, life sciences, web2.0 platform.
  3. 所属分类:software engineering

    • 发布日期:2017-04-16
    • 文件大小:253777
    • 提供者:冯佳颖
  1. Corpus

    0下载:
  2. 对话类语料10万条左右,可用于进行机器人对话训练。-Dialogue about 100,000 words can be used for robot dialogue training.
  3. 所属分类:Software Testing

    • 发布日期:2017-05-25
    • 文件大小:8083295
    • 提供者:马威力
  1. hownet

    0下载:
  2. 知网完整版,附带相关的各种论文文档,中文语料库-see chinese descr iption
  3. 所属分类:software engineering

    • 发布日期:2017-12-10
    • 文件大小:18141953
    • 提供者:smith
搜珍网 www.dssz.com