CDN加速镜像 | 设为首页 | 加入收藏夹
当前位置: 首页 资源下载 搜索资源 - 分词算法

搜索资源列表

  1. 20257147knn

    1下载:
  2. knn最近邻算法在给定新文本后,考虑在训练文本集中与该新文本距离最近(最相似)的 K 篇文本,根据这 K 篇文本所属的类别判定新文本所属的类别,具体的算法步骤如下: 一、:根据特征项集合重新描述训练文本向量 二、:在新文本到达后,根据特征词分词新文本,确定新文本的向量表示 三、:在训练文本集中选出与新文本最相似的 K 个文本-knn nearest neighbor algorithm in the given text, to consider in the train
  3. 所属分类:Other systems

    • 发布日期:2017-04-05
    • 文件大小:43017
    • 提供者:千木流云
  1. sMySSeggh

    0下载:
  2. 最短路径法分词程序源码。将中文句子经过原子切分后生成一个有向无环图,然后使用用Dijkstra算法求出由起点到终点的最短路径以实现中文分词。 -The shortest path method segmentation program source code. Chinese sentence After atomic segmentation, to generate a directed acyclic graph, and then use Dijkstra algorithm to
  3. 所属分类:Windows Develop

    • 发布日期:2017-04-04
    • 文件大小:426045
    • 提供者:chenxing1
  1. Rkeyword-choue

    0下载:
  2. 基于逆向最大匹配算法的分词及基于HMM模型的词性标注系统,包括了未登登录词的识别、数据库的添加等内容。(需要手动修改数据库的路径才可以运行) -Based on the segmentation of the reverse maximum matching algorithm and the HMM-based POS tagging system, including unadvertised login word recognition, and add the database co
  3. 所属分类:Windows Develop

    • 发布日期:2017-05-04
    • 文件大小:1262197
    • 提供者:geli
  1. MyAnalyzer

    0下载:
  2. 简单的中文分词及敏感词检索工具,其中可以任意添加敏感词,并且可以选择使用正向最大匹配算法,逆向最大匹配算法,双向最大匹配算法中的一种进行分词。-Simple Chinese word and sensitive word retrieval tool, which can add any sensitive words, and you can choose to use the forward maximum matching algorithm, reverse maximum matchi
  3. 所属分类:MultiLanguage

    • 发布日期:2017-11-12
    • 文件大小:1325874
    • 提供者:
  1. adarrts-02tarr

    0下载:
  2. 双数组辞典生成程序源码。运用双数组实现trie算法,对于不定长度共同前前缀查询情况,比哈希方法更为有效。经常用于分词辞典的制作。 可直接使用。 -The dual array thesaurus program source code is generated. The use of double-array trie algorithm for indefinite length common prefix query before, Bi Haxi method is more effe
  3. 所属分类:Windows Develop

    • 发布日期:2017-11-20
    • 文件大小:230247
    • 提供者:hxb
  1. ansj_seg-master

    0下载:
  2. 这是一个ictclas的java实现.基本上重写了所有的数据结构和算法.词典是用的开源版的ictclas所提供的.并且进行了部分的人工优化 内存中中文分词每秒钟大约100万字(速度上已经超越ictclas) 文件读取分词每秒钟大约30万字 准确率能达到96 以上-This is a ictclas of java. Basically rewrite all the data structures and algorithms. Dictionary is prov
  3. 所属分类:Java Develop

    • 发布日期:2017-10-30
    • 文件大小:16801760
    • 提供者:王海
  1. Stemmer

    0下载:
  2. 在英语中,一个单词常常是另一个单词的“变种”,如:happy=>happiness,这里happy叫做happiness的词干(stem)。在信息检索系统中,我们常常做的一件事,就是在Term规范化过程中,提取词干(stemming),即除去英文单词分词变换形式的结尾。 应用最为广泛的、中等复杂程度的、基于后缀剥离的词干提取算法是波特词干算法,也叫波特词干器(Porter Stemmer)。详见官方网站。比较热门的检索系统包括Lucene、Whoosh等中的词干过滤器就是采用的波
  3. 所属分类:AI-NN-PR

    • 发布日期:2017-11-25
    • 文件大小:3944
    • 提供者:rongzunhe
  1. splitewords

    0下载:
  2. 在对话框中,调用第三方分词工具(ICTCLAS中文分词免费版),实现对中文的分词示例程序,可以对想实现全文搜索算法的中文分词问题提供解决方案。-In the dialog box, call the third-party segmentation tools (word ICTCLAS Chinese free version), the sample program to achieve the segmentation of Chinese text search algorithms C
  3. 所属分类:File Operate

    • 发布日期:2017-11-28
    • 文件大小:4402678
    • 提供者:李明宇
  1. WordStem_20121024

    0下载:
  2. 采用Porter Stemming算法对英文文本进行分词-Preprocessing English text based on Porter Stemming algorithm
  3. 所属分类:MultiLanguage

    • 发布日期:2017-11-19
    • 文件大小:14987
    • 提供者:RekingQin
  1. ChineseSegment

    0下载:
  2. 一个完整的中文分词程序,有源码,词典,训练集。算法简洁高效,准确率高。包含了一种将标注语料和词典融合的新型分词方法。将语料分割为2:1为训练集和测试集,加上一个外部词典,准确率可以达到95 。适合入门者学习。也适合需要一个简单分词工具的应用。-A Chinese word segmentation procedures, source, dictionary, the training set. The algorithm is simple and efficient, high accura
  3. 所属分类:AI-NN-PR

    • 发布日期:2017-11-13
    • 文件大小:14581979
    • 提供者:张忠辉
  1. 35Improv-word-segment-

    0下载:
  2. 一种改进的中文分词歧义消除算法研究 做中文分词统计语言模型的参考资料-An improved Chinese word segmentation ambiguity elimination algorithm research Do the Chinese word segmentation statistical language model reference material
  3. 所属分类:software engineering

    • 发布日期:2017-11-22
    • 文件大小:592084
    • 提供者:王丽丽
  1. WordsDividing

    0下载:
  2. 这是一个自己写的分词系统,主要用到的算法有最大前向匹配算法和最大熵。-This is a written word segmentation system, mainly used maximum forward matching algorithm and maximum entropy algorithm.
  3. 所属分类:Windows Develop

    • 发布日期:2017-11-19
    • 文件大小:3192658
    • 提供者:两院
  1. ICTCLAS_Demo

    0下载:
  2. 该程序用于短信过滤分析,首先使用ICTCLAS分词系统对输入短信进行分词,接着使用贝叶斯算法分析训练模型。最后对测试集中的短信进行垃圾短信预测。由于短信涉及个人隐私,使用时请自行添加训练数据集和测试数据集-The procedures used for SMS filtering analysis, the first to use the segmentation the ICTCLAS segmentation system input SMS, then use a Bayesian al
  3. 所属分类:Java Develop

    • 发布日期:2017-12-03
    • 文件大小:3007046
    • 提供者:罗翊濠
  1. fencizf

    0下载:
  2. 基于java编程,采用最大匹配算法实现简单的中文分词,并过滤停用词-The maximum matching algorithm based on java programming, simple Chinese word segmentation and filtering stop words
  3. 所属分类:software engineering

    • 发布日期:2017-11-13
    • 文件大小:736256
    • 提供者:赵飞
  1. ExtractorDktj131_2012

    0下载:
  2. 基于复杂网络的新闻网页解析算法,实现复杂网络构建及分词功能-Built complex network based on complex network news page parsing algorithm, and the word function
  3. 所属分类:Search Engine

    • 发布日期:2017-11-15
    • 文件大小:909779
    • 提供者:xcx0617
  1. searching

    0下载:
  2. 中文搜索引擎分词关键技术,包括对典型算法和技术的总结介绍,适合初学者-Chinese words splitting short referenece, for the beginner
  3. 所属分类:MultiLanguage

    • 发布日期:2017-11-10
    • 文件大小:763315
    • 提供者:王旺
  1. IKAnalyzer3.2.0Stable_bin

    0下载:
  2. IKAnalyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始,IKAnalyzer已经推出了3个大版本。最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析算法的中文分词组件。新版本的IKAnalyzer3.0则发展为面向Java的公用分词组件,独立于Lucene项目,同时提供了对Lucene的默认优化实现。 -IKAnalyzer is an open source toolkit, Chinese word segm
  3. 所属分类:Other systems

    • 发布日期:2017-11-10
    • 文件大小:1742374
    • 提供者:yw
  1. RMM

    0下载:
  2. 这个是RMM算法,支持正向、逆向最大匹配,是自然语言处理的重要算法之一,只要替代程序中的词库即可。本词库取自1988年人民日报语料材料,算法对中文分词精确度达到90 以上-This is RMM algorithm supports forward, reverse maximum matching, natural language processing algorithm, as long as the alternative procedures thesaurus can. The th
  3. 所属分类:Search Engine

    • 发布日期:2017-11-09
    • 文件大小:251403
    • 提供者:he
  1. AddressParser

    0下载:
  2. 地址分词解析算法 可以自动分解地址要素-Address word parsing algorithm
  3. 所属分类:source in ebook

    • 发布日期:2017-11-12
    • 文件大小:351539
    • 提供者:zhu jun
  1. bhav-saar-master

    1下载:
  2. 一种自然语言处理的算法 用于情感分析 将一篇文章以关键字的角度来区别正面负面 已经添加了中文词典,可以对中文使用(请对语料先分词)-A natural language processing algorithm for sentiment analysis will be an article with keywords to distinguish between the positive and negative perspective has been added Chinese dict
  3. 所属分类:数据结构常用算法

    • 发布日期:2013-10-14
    • 文件大小:28100473
    • 提供者:jiang
« 1 2 ... 7 8 9 10 11 1213 14 15 »
搜珍网 www.dssz.com