CDN加速镜像 | 设为首页 | 加入收藏夹
当前位置: 首页 资源下载 搜索资源 - 语料

搜索资源列表

  1. bigram1

    1下载:
  2. 根据从语料库中统计出的词表建立二元文法法语言模型-According to statistics from the corpus vocabulary out of the establishment of the dual language model grammar France
  3. 所属分类:Other systems

    • 发布日期:2017-04-16
    • 文件大小:127978
    • 提供者:liujianfei
  1. GetURL

    0下载:
  2. 从URL中WEB挖掘,基于互联网双语语料的获取-web mining from URL,base on the getting the language resorces in internet
  3. 所属分类:Java Develop

    • 发布日期:2017-03-31
    • 文件大小:693
    • 提供者:裴飞
  1. SogouT.mini.tar

    0下载:
  2. 百度搜索引擎具有响应速度快、查找结果准确全面、时效性强、无效链接少、符合中文语言特点和中国人使用习惯等优点。 1...这种方法只需对语料中的字组频度进行统计,不需要切分词典,因而又叫做无词典分词法或统计取词方法。但这种方法也有一定- IHTMLDocument3* pHTMLDoc3 HRESULT hr = m_pHTMLDocument2->QueryInterface(IID_IHTMLDocument3, (LPVOID*)&pHTMLDoc3)
  3. 所属分类:Search Engine

    • 发布日期:2017-03-29
    • 文件大小:62317
    • 提供者:xuhaifan
  1. WindowsApplication1

    0下载:
  2. 处理的对象是:完成分词和词性标注的语料,实现的结果是:统计出现词频完成降序排列。-Dealing with the object are: the completion of word segmentation and POS tagging of the corpus, the results achieved are: the completion of word frequency statistics appear in descending order.
  3. 所属分类:MultiLanguage

    • 发布日期:2017-03-29
    • 文件大小:36724
    • 提供者:陈烨彬
  1. yuyinchulichengxv

    1下载:
  2. 对给定语料估计其基音周期。 要求用MATLAB或C语言实现有关基音检测算法,并给出检测结果。 -For a given corpus to estimate the pitch period. Required to use MATLAB or C language realization of the pitch detection algorithm, and gives test results.
  3. 所属分类:matlab

    • 发布日期:2017-03-29
    • 文件大小:7167
    • 提供者:飞扬
  1. HtmlAgilityPack20

    0下载:
  2. HtmlAgilityPack20 对从网站上爬去的新闻语料抽取出标题,时间,正文等-HtmlAgilityPack20 right from the Web Paqu news corpus extracted title, time, text, etc.
  3. 所属分类:Windows Develop

    • 发布日期:2017-04-24
    • 文件大小:186292
    • 提供者:wony
  1. ChinesePronominalCoreferenceResolution

    0下载:
  2. 基于决策树的汉语代词共指消解 提出一种统计与规则相结合的决策树算法进行汉语代词共指消解 ,利用规则过滤掉属性冲突的反例 ,一定程 度上弥补了决策树算法忽略属性关联性的缺点. 采用 Chinese Treebank 作为语料进行测试 ,手工标注其中的共指 关系和特征向量 首先用规则过滤 ,然后采用 C415 决策树算法选择先行语. 实验结果显示 ,消解成功率为 82159 ,其中人称代词和指示代词的成功率分别为 87160 和 75121 .-A total based on de
  3. 所属分类:AI-NN-PR

    • 发布日期:2017-04-02
    • 文件大小:109887
    • 提供者:pahran
  1. Javaspamfiltering

    1下载:
  2. java 过滤垃圾邮件 贝叶斯过滤 内含语料 有正常邮件 垃圾邮件 便以过滤-java Bayesian filter to filter spam e-mail containing a normal corpus will be to filter spam
  3. 所属分类:Java Develop

    • 发布日期:2017-03-30
    • 文件大小:976122
    • 提供者:章波
  1. LJParser

    0下载:
  2. 聚类算法相关知识,有语料和训练文本集,可供大家学习。-AppWizard has created this application for you. This application not only demonstrates the basics of using the Microsoft Foundation classes but is also a starting point for writing your application.
  3. 所属分类:Other systems

    • 发布日期:2017-06-11
    • 文件大小:18475109
    • 提供者:杨婷
  1. fenci

    0下载:
  2. 分词时,可以使用的词典及其语料。语料是北大1998年语料,已经分好词,并且标好词性。-Word, you can use the dictionary and corpus. Corpus is a corpus of Beijing University in 1998, has been divided into many words, and marked a good part of speech.
  3. 所属分类:Windows Develop

    • 发布日期:2017-05-11
    • 文件大小:2296972
    • 提供者:王宏
  1. IDFCal

    1下载:
  2. tf-idf程序,朋友写的,很好。对中文句子进行相似度计算,有计算句子权值、排序、两两句子之间的相似度计算。有语料,可以直接运行-tf-idf program, friends wrote, very good. Similarity calculation for Chinese sentences, the sentence weights are calculated, sort, twenty-two similarity between sub-calculation. A corpu
  3. 所属分类:Other windows programs

    • 发布日期:2017-04-05
    • 文件大小:16245
    • 提供者:Shirley
  1. 1998renminribaodaiyoucixingbiaozhu

    0下载:
  2. 语音合成训练用语料,分词并带有词性标注。文档性质不是源码。-TTS language training materials, word and with part of speech tagging. The nature of the document is not a source.
  3. 所属分类:Speech/Voice recognition/combine

    • 发布日期:2017-05-10
    • 文件大小:2220975
    • 提供者:wulang
  1. MM2

    1下载:
  2. 利用隐马尔可夫模型实现词性标注。此为无监督模型。 内含语料库和测试集。方便大家学习。--Transition Matrix and Emission Matrix of Hidden Markov Model
  3. 所属分类:Windows编程

    • 发布日期:2014-01-17
    • 文件大小:9519447
    • 提供者:ken
  1. java-text-classter-tool

    0下载:
  2. Java 实现的文本分类工具,包含语料库和实例代码。-Java implementation of text classification tools, including the corpus and the example code.
  3. 所属分类:Java Develop

    • 发布日期:2017-03-26
    • 文件大小:791775
    • 提供者:nana
  1. VoxForge

    0下载:
  2. 高级语音识别语料库,英语专用,HTK必备资料-Advanced speech recognition corpus, English dedicated, HTK essential information
  3. 所属分类:AI-NN-PR

    • 发布日期:2017-05-06
    • 文件大小:1309259
    • 提供者:Fatso Ding
  1. autosummarization

    0下载:
  2. 能够对输入语料进行分词,然后以此为输入自动生成文章摘要。-To segmentation of the input corpus, then used as input automatically generated summary of the article.
  3. 所属分类:Other systems

    • 发布日期:2017-04-05
    • 文件大小:553896
    • 提供者:dingkui
  1. Yard0.2.0

    0下载:
  2. 用JAVA实现的中文语料分割。使用时直接点击yard批处理文件在DOS界面操作。 -Implemented with JAVA Chinese corpus segmentation. Click the yard when used directly in the DOS batch file interface operation.
  3. 所属分类:Java Develop

    • 发布日期:2017-05-06
    • 文件大小:1445175
    • 提供者:成立
  1. 1

    0下载:
  2. 基于WEKA平台的文本聚类研究与实现 文本聚类是文本挖掘领域的一个重要研究分支,是聚类方法在文本处理领域的应用。本文对基于空间向量模型的文本聚类过程做了较深入的讨论和总结,利用文本语料库,基于数据挖掘工具研究并实现了文本聚类的过程。本文首先给出了文本聚类的思想和过程,回顾了文本聚类领域的已有成果,列举了文本聚类领域在特征表示、特征提取等方面的基础研究工作。另外,本文回顾了现有的文本聚类算法,以及常用的文本聚类效果评价指标。在研究了已有成果的基础上,本文利用20 Newsgroup文本语料库,
  3. 所属分类:Windows Develop

    • 发布日期:2017-03-30
    • 文件大小:1023117
    • 提供者:yueyue
  1. ICTCLAS50_Windows_32_JNI

    0下载:
  2. 中科院分词软件,用于语料预处理,不错的。-ictclass word split
  3. 所属分类:Windows Develop

    • 发布日期:2017-05-28
    • 文件大小:11253142
    • 提供者:刘雯
  1. WekaTest

    0下载:
  2. weka包+eclipse完成中文语料库分词 分类-weka package+ eclipse complete classification of Chinese word segmentation corpus
  3. 所属分类:Other systems

    • 发布日期:2017-05-29
    • 文件大小:11498591
    • 提供者:陈蓉
« 1 2 3 4 5 67 8 9 10 11 12 13 »
搜珍网 www.dssz.com