搜索资源 - 语料库 - 搜珍网

CDN加速镜像 | 设为首页 | 加入收藏夹

热门搜索： 源码 Android 整站插件识别 p2p OpenCV 网络编程游戏源码算法更多...

登陆 | 会员注册

当前位置：

搜索资源 - 语料库

下载资源主分类

源码下载

Web源码

开发工具

文档下载

其它资源

资源分类

搜索资源列表

RMM

0下载：
这个是RMM算法，支持正向、逆向最大匹配，是自然语言处理的重要算法之一，只要替代程序中的词库即可。本词库取自1988年人民日报语料材料，算法对中文分词精确度达到90 以上-This is RMM algorithm supports forward, reverse maximum matching, natural language processing algorithm, as long as the alternative procedures thesaurus can. The th
所属分类：Search Engine
- 发布日期：2017-11-09
- 文件大小：251403
- 提供者：he

jrxbck

0下载：
用于数据分析的金融细胞词库，详细收集了金融行业的细胞词用户语料分析-For financial cell thesaurus data analysis, detailed analysis of cell collected corpus word user of the financial industry
所属分类：File Formats
- 发布日期：2017-04-25
- 文件大小：132648
- 提供者：guochao

download

3下载：
DMO-DB[24]是由柏林工业大学录制的德语情感语音库,由10位演员(5男5女)对10个语句(5长5短)进行7种情感(中性/nertral、生气/anger、害怕/fear、高兴/joy、悲伤/sadness、厌恶/disgust、无聊/boredom)的模拟得到,共包含800句语料,采样率48kHz(后压缩到16kHz),16bit量化.语料文本的选取遵从语义中性、无情感倾向的原则,且为日常口语化风格,无过多的书面语修饰.语音的录制在专业录音室中完成,要求演员在演绎某个特定情感前通过回忆自身
所属分类：其他
- 发布日期：2018-01-07
- 文件大小：40566784
- 提供者：dy王

news_tensite_xml.smarty (1)

0下载：
上传训练语料。关于文本分类语料库的问题搜狗实验室搜狗实验室(Sogou Labs)是搜狗搜索核心研发团队对外交流的窗口，期望通过这个平台，展现搜狗研发团队强大的研发(Uploading training corpus)
所属分类：其他
- 发布日期：2018-05-02
- 文件大小：103424
- 提供者：smile_cailei

dialogue_policy_dqn-master

0下载：
基于DQN的对话决策研究，利用深度增强学习，可以通过大量的语料库实现比较好的效果。(Research on Dialogic decision based on DQN)
所属分类：网络编程
- 发布日期：2019-09-23
- 文件大小：799744
- 提供者：ES2157

rt-polaritydata

1下载：
该文档可在机器学习中用于文本分类的语料库，内涵一个正面语料文档和一个负面语料文档。(This document is a corpus for text categorization in machine learning, with a positive corpus document and a negative corpus document.)
所属分类：文章/文档
- 发布日期：2021-01-17
- 文件大小：488448
- 提供者：fluffy

BosoNnlp

1下载：
玻森专注中文语义分析技术，拥有丰富的经验积累。自主研发千万级中文语料库，为精准和深度的中文语义分析提供坚实基础。一站式解决您的中文语义分析需求。多个语义分析API，从情感倾向、实体、分类等方面。官网只有python版本，现上传Java的实例。(He focuses on Chinese semantic analysis technology and has rich experience. Independently developing tens of millions of Chinese
所属分类：Windows编程
- 发布日期：2020-09-29
- 文件大小：9054208
- 提供者：hhitkyA

homework3

1下载：
将二位数据投影到一维线性， LDA（Latent Dirichlet Allocation）是一种文档主题生成模型，也称为一个三层贝叶斯概率模型，包含词、主题和文档三层结构。所谓生成模型，就是说，我们认为一篇文章的每个词都是通过“以一定概率选择了某个主题，并从这个主题中以一定概率选择某个词语”这样一个过程得到。文档到主题服从多项式分布，主题到词服从多项式分布。 [1] LDA是一种非监督机器学习技术，可以用来识别大规模文档集（document collection）或语料库（corpus）
所属分类：图形/文字识别
- 发布日期：2020-02-27
- 文件大小：3072
- 提供者：叶随风

自然语言处理课程设计代码

0下载：
一、宋词词频统计：语料库：ci.txt 要求：编程序，输入ci，自动分析统计ci.txt，统计宋词的单字词，双字词等。统计后，输出的是单字词和双字词的词典文件。文件中包括相应的词和频度（次数）。二：宋词自动生成：语料库：ci.txt 要求：输入词牌，基于宋词的词典和宋词的词牌，可以随机或者按照语言模型，自动生成宋词。设计相应的Ui或者Web界面。四、中文词法分析系统：语料库：1998-01-2003版-带音.txt 要求：根据构建的单词词典和双词词典，用n-gram模型，或者前向最
所属分类：系统编程
- 发布日期：2019-12-22
- 文件大小：2528139
- 提供者：QQLogin_5D1A91365246BF8B

合工大自然语言处理报告代码

6下载：
四、中文词法分析系统 1、实验要求语料库：1998-01-2003版-带音.txt 要求：根据构建的单词词典和双词词典，用n-gram模型，或者前向最长匹配，或者后向最长匹配等算法，鼓励用更复杂一些的方法来进行，包括隐马尔科夫模型和条件随机场模型。二、宋词自动生成 1、实验要求语料库：ci.txt 要求：输入词牌，基于宋词的词典和宋词的词牌，可以随机或者按照语言模型，自动生成宋词。设计相应的Ui或者Web界面。实现了隐马尔科夫模型分词
所属分类：人工智能/神经网络/遗传算法
- 发布日期：2019-12-22
- 文件大小：8836520
- 提供者：273498776@qq.com

« 1 2 3 4 5 6 7»

搜珍网 www.dssz.com

本网站为编程资源及源代码搜集、介绍的搜索网站，版权归原作者所有！　　粤ICP备11031372号

1999-2046 搜珍网 All Rights Reserved.