CDN加速镜像 | 设为首页 | 加入收藏夹
当前位置: 首页 资源下载 源码下载 搜索资源 - 语料

搜索资源列表

  1. autosummarization

    0下载:
  2. 能够对输入语料进行分词,然后以此为输入自动生成文章摘要。-To segmentation of the input corpus, then used as input automatically generated summary of the article.
  3. 所属分类:Other systems

    • 发布日期:2017-04-05
    • 文件大小:553896
    • 提供者:dingkui
  1. 1

    0下载:
  2. 基于WEKA平台的文本聚类研究与实现 文本聚类是文本挖掘领域的一个重要研究分支,是聚类方法在文本处理领域的应用。本文对基于空间向量模型的文本聚类过程做了较深入的讨论和总结,利用文本语料库,基于数据挖掘工具研究并实现了文本聚类的过程。本文首先给出了文本聚类的思想和过程,回顾了文本聚类领域的已有成果,列举了文本聚类领域在特征表示、特征提取等方面的基础研究工作。另外,本文回顾了现有的文本聚类算法,以及常用的文本聚类效果评价指标。在研究了已有成果的基础上,本文利用20 Newsgroup文本语料库,
  3. 所属分类:Windows Develop

    • 发布日期:2017-03-30
    • 文件大小:1023117
    • 提供者:yueyue
  1. ICTCLAS50_Windows_32_JNI

    0下载:
  2. 中科院分词软件,用于语料预处理,不错的。-ictclass word split
  3. 所属分类:Windows Develop

    • 发布日期:2017-05-28
    • 文件大小:11253142
    • 提供者:刘雯
  1. WekaTest

    0下载:
  2. weka包+eclipse完成中文语料库分词 分类-weka package+ eclipse complete classification of Chinese word segmentation corpus
  3. 所属分类:Other systems

    • 发布日期:2017-05-29
    • 文件大小:11498591
    • 提供者:陈蓉
  1. jiyinjiance

    1下载:
  2. 基音检测: 对给定语料估计其基音周期。 要求用MATLAB或C语言实现有关基音检测算法,并给出检测结果与实验报告 实验语料:MaoYiSheng.raw 发音:“茅以升”;时长0.9s;采样率:8kHz;量化精度为16bits/sample;数据格式 LSB,MSB 分析帧长:20ms(160样点) 总帧数:45-Pitch Detection: For a given corpus to estimate the pitch period. Require MAT
  3. 所属分类:matlab

    • 发布日期:2017-04-02
    • 文件大小:932
    • 提供者:zhangyanshan
  1. qwvvfg

    0下载:
  2. 基于语料库的中文姓名识别方法研究 本文在大规模语料基础上提取和分析了中文姓氏和名字用字的使用频率,研究了 中文姓名识别的评价函数,动态地建立了姓名识别统计数据表和姓名阅值-Corpus-based Study of Chinese Names Recognition Based on the large-scale extraction and analysis of corpus based on the first and last name in Chinese character
  3. 所属分类:Graph Recognize

    • 发布日期:2017-04-05
    • 文件大小:280298
    • 提供者:张驰
  1. wordsimilar

    0下载:
  2. 词汇分类 相似度计算 文本语料分析 归类 知网数据分类-Word text corpus classification Similarity analysis of data classified Text Classification
  3. 所属分类:Windows Develop

    • 发布日期:2017-04-16
    • 文件大小:388840
    • 提供者:wayne
  1. 20117230242204

    0下载:
  2. 有关语料处理的代码,包括简单分词,语法树分析 -The corpus processing code, including a simple word, syntax tree analysis
  3. 所属分类:Data structs

    • 发布日期:2017-05-09
    • 文件大小:1986327
    • 提供者:tyina1212
  1. Retrieval

    0下载:
  2. 文本检索,MFC界面,对语料库进行检索,输出带有关键字的语句-Text retrieval, MFC interface, the corpus search, output of statement with the keyword
  3. 所属分类:GUI Develop

    • 发布日期:2017-06-01
    • 文件大小:13952341
    • 提供者:王蔚
  1. mm

    0下载:
  2. 通过与训练语料库中进行比对,对指定文本进行前向分词与后向分词。训练语料库为人民日报1998年1月的文章,训练语料是已经分好词的-fmm and bmm cut words
  3. 所属分类:File Operate

    • 发布日期:2017-05-24
    • 文件大小:8164918
    • 提供者:何钟豪
  1. cilinciku

    0下载:
  2. 同义词词林的mdb格式汉语词库,作为语义分析的语料库使用-The synonyms Cilin mdb format Chinese Word
  3. 所属分类:Other Databases

    • 发布日期:2017-05-02
    • 文件大小:553227
    • 提供者:
  1. yuliao199801

    0下载:
  2. 人民日报标注语料1998年1月份,语义分析的实用的语料库-People s Daily corpus of label in January 1998, semantic analysis, practical corpus
  3. 所属分类:Compiler program

    • 发布日期:2017-05-13
    • 文件大小:3541154
    • 提供者:hyyt11
  1. TextClassify-KNN-SVM

    0下载:
  2. 根据语料库对文本进行分类,有界面,KNN、贝叶斯方法-According to the corpus, text classification KNN, bayesian
  3. 所属分类:Graph Recognize

    • 发布日期:2017-05-16
    • 文件大小:4335741
    • 提供者:jack
  1. AIML

    0下载:
  2. AIML 人工智能,可以与人类交流,但需要大量的语料.-AIML robot ,can communicaton
  3. 所属分类:CSharp

    • 发布日期:2017-03-29
    • 文件大小:625158
    • 提供者:albert
  1. Kernel-for-Relation-Extraction

    0下载:
  2. 最短的路径依赖关系提取 我们提出了一个新颖的方法来提取关系,根据观察断言之间的关系之间的两个命名实体在同一个句子1所需的信息通常是由两个实体之间的依赖关系图中的最短路径捕获。实验上提取的ACE(自动内容抽取)报纸语料表明,新的最短路径依赖内核外执行最近的做法,根据去依赖树内核顶层的关系-We present a novel approach to relation extraction, based on the observation that the information requir
  3. 所属分类:Data structs

    • 发布日期:2017-03-30
    • 文件大小:133104
    • 提供者:xz
  1. ScriptProject

    0下载:
  2. 将现有的的文章利用语料库中的词语将其分分割成不同词语就可以断开,还包含界面-segment the essay use the direction existed
  3. 所属分类:Other systems

    • 发布日期:2017-04-13
    • 文件大小:2251
    • 提供者:Chen Jiawei
  1. yuliaoku

    0下载:
  2. 是一个很好 语料库,可以用来进行训练分类器。如果使用,是一个很好的选择,适合新手学习。-Is a good corpus, can be used to train the classifier. If you are using is a good choice for novice learning.
  3. 所属分类:Other Databases

    • 发布日期:2017-05-12
    • 文件大小:2860546
    • 提供者:王浩
  1. onTextCategorization

    0下载:
  2. 本文比较研究了在中文文本分类中特征选取方法对分类效果的影响。考察了文档频率DF、信息增 益IG、互信息MI、V2分布CHI 四种不同的特征选取方法。采用支持向量机(SVM) 和KNN两种不同的分类 器以考察不同抽取方法的有效性。实验结果表明, 在英文文本分类中表现良好的特征抽取方法( IG、MI 和 CHI)在不加修正的情况下并不适合中文文本分类。文中从理论上分析了产生差异的原因, 并分析了可能的 矫正方法包括采用超大规模训练语料和采用组合的特征抽取方法。最后通过实验验证组合特征
  3. 所属分类:AI-NN-PR

    • 发布日期:2017-03-30
    • 文件大小:240923
    • 提供者:xz
  1. som_antconc_results

    0下载:
  2. 聚类是对数据对象进行划分的一种过程,与分类不同的是,它所划分的类是未知的,这是一个“无指导的学习” 过程,本文件采用基于MATLAB GUI 编写了SOM的神经网络语料聚类分析-Corpus clustering of the SOM-based neural network analysis
  3. 所属分类:AI-NN-PR

    • 发布日期:2017-05-20
    • 文件大小:5829806
    • 提供者:黄晓明
  1. transfer.py.tar

    0下载:
  2. 通过Unicode内码值计算,将中文全角标点符号转换为中文半角标点符号的Python脚本,可用于统一语料中的标点符号全半角。-Code value in Unicode within the Chinese full-width punctuation into Chinese half-width punctuation Python scr ipt can be used for the width of a unified corpus of punctuation.
  3. 所属分类:AI-NN-PR

    • 发布日期:2017-04-03
    • 文件大小:557
    • 提供者:滑车
« 1 2 3 4 5 67 8 9 10 11 »
搜珍网 www.dssz.com