CDN加速镜像 | 设为首页 | 加入收藏夹
当前位置: 首页 资源下载 搜索资源 - 语料库

搜索资源列表

  1. RMM

    0下载:
  2. 这个是RMM算法,支持正向、逆向最大匹配,是自然语言处理的重要算法之一,只要替代程序中的词库即可。本词库取自1988年人民日报语料材料,算法对中文分词精确度达到90 以上-This is RMM algorithm supports forward, reverse maximum matching, natural language processing algorithm, as long as the alternative procedures thesaurus can. The th
  3. 所属分类:Search Engine

    • 发布日期:2017-11-09
    • 文件大小:251403
    • 提供者:he
  1. jrxbck

    0下载:
  2. 用于数据分析的金融细胞词库,详细收集了金融行业的细胞词用户语料分析-For financial cell thesaurus data analysis, detailed analysis of cell collected corpus word user of the financial industry
  3. 所属分类:File Formats

    • 发布日期:2017-04-25
    • 文件大小:132648
    • 提供者:guochao
  1. download

    3下载:
  2. DMO-DB[24]是由柏林工业大学录制的德语情感语音库,由10位演员(5男5女)对10个语句(5长5短)进行7种情感(中性/nertral、生气/anger、害怕/fear、高兴/joy、悲伤/sadness、厌恶/disgust、无聊/boredom)的模拟得到,共包含800句语料,采样率48kHz(后压缩到16kHz),16bit量化.语料文本的选取遵从语义中性、无情感倾向的原则,且为日常口语化风格,无过多的书面语修饰.语音的录制在专业录音室中完成,要求演员在演绎某个特定情感前通过回忆自身
  3. 所属分类:其他

    • 发布日期:2018-01-07
    • 文件大小:40566784
    • 提供者:dy王
  1. news_tensite_xml.smarty (1)

    0下载:
  2. 上传训练语料。关于文本分类语料库的问题搜狗实验室搜狗实验室(Sogou Labs)是搜狗搜索核心研发团队对外交流的窗口,期望通过这个平台,展现搜狗研发团队强大的研发(Uploading training corpus)
  3. 所属分类:其他

    • 发布日期:2018-05-02
    • 文件大小:103424
    • 提供者:smile_cailei
  1. dialogue_policy_dqn-master

    0下载:
  2. 基于DQN的对话决策研究,利用深度增强学习,可以通过大量的语料库实现比较好的效果。(Research on Dialogic decision based on DQN)
  3. 所属分类:网络编程

    • 发布日期:2019-09-23
    • 文件大小:799744
    • 提供者:ES2157
  1. rt-polaritydata

    1下载:
  2. 该文档可在机器学习中用于文本分类的语料库,内涵一个正面语料文档和一个负面语料文档。(This document is a corpus for text categorization in machine learning, with a positive corpus document and a negative corpus document.)
  3. 所属分类:文章/文档

    • 发布日期:2021-01-17
    • 文件大小:488448
    • 提供者:fluffy
  1. BosoNnlp

    1下载:
  2. 玻森专注中文语义分析技术,拥有丰富的经验积累。自主研发千万级中文语料库,为精准和深度的中文语义分析提供坚实基础。一站式解决您的中文语义分析需求。多个语义分析API,从情感倾向、实体、分类等方面。官网只有python版本,现上传Java的实例。(He focuses on Chinese semantic analysis technology and has rich experience. Independently developing tens of millions of Chinese
  3. 所属分类:Windows编程

    • 发布日期:2020-09-29
    • 文件大小:9054208
    • 提供者:hhitkyA
  1. homework3

    1下载:
  2. 将二位数据投影到一维线性, LDA(Latent Dirichlet Allocation)是一种文档主题生成模型,也称为一个三层贝叶斯概率模型,包含词、主题和文档三层结构。所谓生成模型,就是说,我们认为一篇文章的每个词都是通过“以一定概率选择了某个主题,并从这个主题中以一定概率选择某个词语”这样一个过程得到。文档到主题服从多项式分布,主题到词服从多项式分布。 [1] LDA是一种非监督机器学习技术,可以用来识别大规模文档集(document collection)或语料库(corpus)
  3. 所属分类:图形/文字识别

    • 发布日期:2020-02-27
    • 文件大小:3072
    • 提供者:叶随风
  1. 自然语言处理课程设计代码

    0下载:
  2. 一、宋词词频统计:语料库:ci.txt 要求:编程序,输入ci,自动分析统计ci.txt,统计宋词的单字词,双字词等。统计后,输出的是单字词和双字词的词典文件。文件中包括相应的词和频度(次数)。 二:宋词自动生成:语料库:ci.txt 要求:输入词牌,基于宋词的词典和宋词的词牌,可以随机或者按照语言模型,自动生成宋词。设计相应的Ui或者Web界面。 四、中文词法分析系统:语料库:1998-01-2003版-带音.txt 要求:根据构建的单词词典和双词词典,用n-gram模型,或者前向最
  3. 所属分类:系统编程

  1. 合工大自然语言处理报告代码

    6下载:
  2. 四、中文词法分析系统 1、实验要求 语料库:1998-01-2003版-带音.txt 要求:根据构建的单词词典和双词词典,用n-gram模型,或者前向最长匹配,或者后向最长匹配等算法,鼓励用更复杂一些的方法来进行,包括隐马尔科夫模型和条件随机场模型。 二、宋词自动生成 1、实验要求 语料库:ci.txt 要求:输入词牌,基于宋词的词典和宋词的词牌,可以随机或者按照语言模型,自动生成宋词。设计相应的Ui或者Web界面。 实现了隐马尔科夫模型分词
  3. 所属分类:人工智能/神经网络/遗传算法

« 1 2 3 4 5 6 7»
搜珍网 www.dssz.com