搜索资源 - 语料 - 搜珍网

CDN加速镜像 | 设为首页 | 加入收藏夹

热门搜索： 源码 Android 整站插件识别 p2p OpenCV 网络编程游戏源码算法更多...

登陆 | 会员注册

当前位置：

搜索资源 - 语料

下载资源主分类

源码下载

Web源码

开发工具

文档下载

其它资源

资源分类

Windows编程

Internet/网络编程

系统编程

通讯/手机编程

游戏

多媒体

嵌入式/单片机编程

图形图象

数值算法/人工智能

行业应用软件

数据库系统

其它

搜索资源列表

autosummarization

0下载：
能够对输入语料进行分词，然后以此为输入自动生成文章摘要。-To segmentation of the input corpus, then used as input automatically generated summary of the article.
所属分类：Other systems
- 发布日期：2017-04-05
- 文件大小：553896
- 提供者：dingkui

1

0下载：
基于WEKA平台的文本聚类研究与实现文本聚类是文本挖掘领域的一个重要研究分支，是聚类方法在文本处理领域的应用。本文对基于空间向量模型的文本聚类过程做了较深入的讨论和总结，利用文本语料库，基于数据挖掘工具研究并实现了文本聚类的过程。本文首先给出了文本聚类的思想和过程，回顾了文本聚类领域的已有成果，列举了文本聚类领域在特征表示、特征提取等方面的基础研究工作。另外，本文回顾了现有的文本聚类算法，以及常用的文本聚类效果评价指标。在研究了已有成果的基础上，本文利用20 Newsgroup文本语料库，
所属分类：Windows Develop
- 发布日期：2017-03-30
- 文件大小：1023117
- 提供者：yueyue

ICTCLAS50_Windows_32_JNI

0下载：
中科院分词软件，用于语料预处理，不错的。-ictclass word split
所属分类：Windows Develop
- 发布日期：2017-05-28
- 文件大小：11253142
- 提供者：刘雯

WekaTest

0下载：
weka包+eclipse完成中文语料库分词分类-weka package+ eclipse complete classification of Chinese word segmentation corpus
所属分类：Other systems
- 发布日期：2017-05-29
- 文件大小：11498591
- 提供者：陈蓉

jiyinjiance

1下载：
基音检测：对给定语料估计其基音周期。要求用MATLAB或C语言实现有关基音检测算法，并给出检测结果与实验报告实验语料：MaoYiSheng.raw 发音：“茅以升”；时长0.9s；采样率：8kHz；量化精度为16bits/sample；数据格式 LSB,MSB 分析帧长:20ms(160样点) 总帧数：45-Pitch Detection: For a given corpus to estimate the pitch period. Require MAT
所属分类：matlab
- 发布日期：2017-04-02
- 文件大小：932
- 提供者：zhangyanshan

qwvvfg

0下载：
基于语料库的中文姓名识别方法研究本文在大规模语料基础上提取和分析了中文姓氏和名字用字的使用频率，研究了中文姓名识别的评价函数，动态地建立了姓名识别统计数据表和姓名阅值-Corpus-based Study of Chinese Names Recognition Based on the large-scale extraction and analysis of corpus based on the first and last name in Chinese character
所属分类：Graph Recognize
- 发布日期：2017-04-05
- 文件大小：280298
- 提供者：张驰

wordsimilar

0下载：
词汇分类相似度计算文本语料分析归类知网数据分类-Word text corpus classification Similarity analysis of data classified Text Classification
所属分类：Windows Develop
- 发布日期：2017-04-16
- 文件大小：388840
- 提供者：wayne

20117230242204

0下载：
有关语料处理的代码，包括简单分词，语法树分析 -The corpus processing code, including a simple word, syntax tree analysis
所属分类：Data structs
- 发布日期：2017-05-09
- 文件大小：1986327
- 提供者：tyina1212

Retrieval

0下载：
文本检索，MFC界面，对语料库进行检索，输出带有关键字的语句-Text retrieval, MFC interface, the corpus search, output of statement with the keyword
所属分类：GUI Develop
- 发布日期：2017-06-01
- 文件大小：13952341
- 提供者：王蔚

mm

0下载：
通过与训练语料库中进行比对，对指定文本进行前向分词与后向分词。训练语料库为人民日报1998年1月的文章，训练语料是已经分好词的-fmm and bmm cut words
所属分类：File Operate
- 发布日期：2017-05-24
- 文件大小：8164918
- 提供者：何钟豪

cilinciku

0下载：
同义词词林的mdb格式汉语词库，作为语义分析的语料库使用-The synonyms Cilin mdb format Chinese Word
所属分类：Other Databases
- 发布日期：2017-05-02
- 文件大小：553227
- 提供者：

yuliao199801

0下载：
人民日报标注语料1998年1月份，语义分析的实用的语料库-People s Daily corpus of label in January 1998, semantic analysis, practical corpus
所属分类：Compiler program
- 发布日期：2017-05-13
- 文件大小：3541154
- 提供者：hyyt11

TextClassify-KNN-SVM

0下载：
根据语料库对文本进行分类，有界面，KNN、贝叶斯方法-According to the corpus, text classification KNN, bayesian
所属分类：Graph Recognize
- 发布日期：2017-05-16
- 文件大小：4335741
- 提供者：jack

AIML

0下载：
AIML 人工智能,可以与人类交流，但需要大量的语料.-AIML robot ,can communicaton
所属分类：CSharp
- 发布日期：2017-03-29
- 文件大小：625158
- 提供者：albert

Kernel-for-Relation-Extraction

0下载：
最短的路径依赖关系提取我们提出了一个新颖的方法来提取关系，根据观察断言之间的关系之间的两个命名实体在同一个句子1所需的信息通常是由两个实体之间的依赖关系图中的最短路径捕获。实验上提取的ACE（自动内容抽取）报纸语料表明，新的最短路径依赖内核外执行最近的做法，根据去依赖树内核顶层的关系-We present a novel approach to relation extraction, based on the observation that the information requir
所属分类：Data structs
- 发布日期：2017-03-30
- 文件大小：133104
- 提供者：xz

ScriptProject

0下载：
将现有的的文章利用语料库中的词语将其分分割成不同词语就可以断开，还包含界面-segment the essay use the direction existed
所属分类：Other systems
- 发布日期：2017-04-13
- 文件大小：2251
- 提供者：Chen Jiawei

yuliaoku

0下载：
是一个很好语料库，可以用来进行训练分类器。如果使用，是一个很好的选择，适合新手学习。-Is a good corpus, can be used to train the classifier. If you are using is a good choice for novice learning.
所属分类：Other Databases
- 发布日期：2017-05-12
- 文件大小：2860546
- 提供者：王浩

onTextCategorization

0下载：
本文比较研究了在中文文本分类中特征选取方法对分类效果的影响。考察了文档频率DF、信息增益IG、互信息MI、V2分布CHI 四种不同的特征选取方法。采用支持向量机(SVM) 和KNN两种不同的分类器以考察不同抽取方法的有效性。实验结果表明, 在英文文本分类中表现良好的特征抽取方法( IG、MI 和 CHI)在不加修正的情况下并不适合中文文本分类。文中从理论上分析了产生差异的原因, 并分析了可能的矫正方法包括采用超大规模训练语料和采用组合的特征抽取方法。最后通过实验验证组合特征
所属分类：AI-NN-PR
- 发布日期：2017-03-30
- 文件大小：240923
- 提供者：xz

som_antconc_results

0下载：
聚类是对数据对象进行划分的一种过程，与分类不同的是，它所划分的类是未知的，这是一个“无指导的学习” 过程，本文件采用基于MATLAB GUI 编写了SOM的神经网络语料聚类分析-Corpus clustering of the SOM-based neural network analysis
所属分类：AI-NN-PR
- 发布日期：2017-05-20
- 文件大小：5829806
- 提供者：黄晓明

transfer.py.tar

0下载：
通过Unicode内码值计算，将中文全角标点符号转换为中文半角标点符号的Python脚本，可用于统一语料中的标点符号全半角。-Code value in Unicode within the Chinese full-width punctuation into Chinese half-width punctuation Python scr ipt can be used for the width of a unified corpus of punctuation.
所属分类：AI-NN-PR
- 发布日期：2017-04-03
- 文件大小：557
- 提供者：滑车

« 1 2 3 4 5 67 8 9 10 11 »

搜珍网 www.dssz.com

本网站为编程资源及源代码搜集、介绍的搜索网站，版权归原作者所有！　　粤ICP备11031372号

1999-2046 搜珍网 All Rights Reserved.