CDN加速镜像 | 设为首页 | 加入收藏夹
当前位置: 首页 资源下载 搜索资源 - 分词算法

搜索资源列表

  1. PExtractor

    0下载:
  2. 地名抽取算法,利用开源分词组件,并增加了地名前词识别,地名组合等逻辑。-Names extraction algorithm, using open-source word components, and increases the names before the word recognition, place names and combination logic.
  3. 所属分类:Other systems

    • 发布日期:2017-05-14
    • 文件大小:3205737
    • 提供者:chensd
  1. ycsfwordseg

    0下载:
  2. 基于遗传算法的分词论文 基于遗传算法的分词论文-Segmentation Based on Genetic Algorithms PapersSegmentation Based on Genetic Algorithms PapersSegmentation Based on Genetic Algorithms Papers
  3. 所属分类:AI-NN-PR

    • 发布日期:2017-04-24
    • 文件大小:195967
    • 提供者:racheldo
  1. code

    0下载:
  2. 这其中涉及了黑名单、文本分类算法、短信内容分词、特征向量 选取等关键技术-That involves a black list, text classification algorithm, SMS is divided into words, feature vector selected key technologies such as
  3. 所属分类:Data structs

    • 发布日期:2017-04-04
    • 文件大小:89622
    • 提供者:汪浩
  1. CLucene

    0下载:
  2. clucene 源码,并且增加了自己写的正向最大匹配算法的分词程序。-clucene source code, and increase their own to write the forward maximum matching algorithm for the sub-word program.
  3. 所属分类:AI-NN-PR

    • 发布日期:2017-03-27
    • 文件大小:440298
    • 提供者:yimi
  1. java

    0下载:
  2. java最大正向匹配算法 帮助大家了解分词原理-java maximum matching algorithm to help you understand the positive word principle
  3. 所属分类:JavaScript

    • 发布日期:2017-04-06
    • 文件大小:1126
    • 提供者:刘超
  1. lucene-3.0.1-src

    0下载:
  2. Lucene算法最新源码包,提供给中文分词器开发者最好的工具!-Lucene algorithm is the latest source package available to the Chinese word device developers the best tools!
  3. 所属分类:Jsp/Servlet

    • 发布日期:2017-06-01
    • 文件大小:14024903
    • 提供者:
  1. IKAnalyzer3.2.0Stable_src

    0下载:
  2. IKAnalyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始,IKAnalyzer已经推出了3个大版本。最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析算法的中文分词组件。新版本的IKAnalyzer3.0则发展为面向Java的公用分词组件,独立于Lucene项目,同时提供了对Lucene的默认优化实现。 IKAnalyzer3.0特性: 采用了特有的“正向迭代最细粒度切分算法“,具有60万字/秒的高速处理能力。
  3. 所属分类:Jsp/Servlet

    • 发布日期:2017-04-10
    • 文件大小:1094666
    • 提供者:木划
  1. File22

    0下载:
  2. 基于关键词的Web文档自动分类算法研究,文档关键词,语义相似度,聚类算法,知网,拓扑网络图,中文分词-Keyword-based Web Document Classification Algorithm, document keywords, semantic similarity, clustering algorithm, HowNet, topological network diagrams, Chinese word segmentation
  3. 所属分类:software engineering

    • 发布日期:2017-05-10
    • 文件大小:2123798
    • 提供者:王三
  1. chiword_seg

    0下载:
  2. 本代码含有逆向最大,正向最大,最短路径等自动识别算法,实现文本中分词的自动识别。-This code contains the largest reverse, forward the most, such as automatic identification shortest path algorithm to achieve automatic recognition of text carved words.
  3. 所属分类:Graph Recognize

    • 发布日期:2017-04-07
    • 文件大小:14070
    • 提供者:zhang
  1. Chinese-text-categorization-Study

    1下载:
  2. 本文通过对Bayes、KNN、SVM 应用于中文文本分类进行比较实验研究。 应用ICTCLAS 对中文文档进行分词,在大维数,多数据情况下应用TFIDF 进行 特征选择,并同时利用它实现了对特征项进行加权处理,使文本库中的每个文本 具有统一的、可处理的结构模型。然后通过三类分类算法实现了对权值数据进行 训练和分类。-Based on the Bayes, KNN, SVM applied to compare the Chinese text ca
  3. 所属分类:Mathimatics-Numerical algorithms

    • 发布日期:2017-03-29
    • 文件大小:442391
    • 提供者:wulili
  1. svmcls

    0下载:
  2. 基于KNN+SVM算法的文本分类器,附带权威的分词词库及算法,有界面,程序可正常使用-KNN+ SVM-based text classification algorithm, with the authority of the sub-word thesaurus and algorithm, a interface, the program can be used normally
  3. 所属分类:Windows Develop

    • 发布日期:2017-06-21
    • 文件大小:37651520
    • 提供者:talon
  1. Bayes

    0下载:
  2. 用bayes实现的聚类算法,分词采用的是SharpICTCLAS分词系统 1.0-Achieved using bayes clustering algorithm, word segmentation is used SharpICTCLAS System 1.0
  3. 所属分类:.net

    • 发布日期:2017-06-01
    • 文件大小:13979515
    • 提供者:Fu
  1. IKAnalyzer_V3.2.8

    0下载:
  2. IK Analyzer是一个开源的,基于java诧言开发的轻量级的中文分词工具包。最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析算法的中文分词组件。新版本的IK Analyzer 3.X则发展为面吐Java的公用分词组件,独立于Lucene项目,同时提供了对Lucene的默认优化实现。-IK Analyzer 3.X
  3. 所属分类:Java Develop

    • 发布日期:2017-04-01
    • 文件大小:715716
    • 提供者:flymoon
  1. boosting_src

    0下载:
  2. Boosting中的AdaBoost.M1算法在文本分类中的应用实现。使用ICTCLAS用于中文分词,弱分类器使用Naive Bayes。程序参数使用配置文件的格式。-Application of text classification using AdaBoost.M1. Use ICTCLAS tool in Chinese segment, and use Naive Bayes as the weak classifier. use the config file as the para
  3. 所属分类:Linux-Unix program

    • 发布日期:2017-05-16
    • 文件大小:4137477
    • 提供者:彭卫华
  1. EasySeg

    0下载:
  2. 实现中文分词的最大正向匹配算法,提前输入好文本。-Achieve maximum positive Chinese word matching algorithms, a good text input in advance
  3. 所属分类:MultiLanguage

    • 发布日期:2017-04-01
    • 文件大小:923687
    • 提供者:宋园园
  1. WordSegment

    0下载:
  2. 用C++开发的分词系统 运用基于哈希的逆向最大匹配算法 基于词典-Word in C development system uses a hash-based reverse maximum matching algorithm is based on dictionary
  3. 所属分类:Data structs

    • 发布日期:2016-08-04
    • 文件大小:334848
    • 提供者:zhuangkun
  1. WordTest

    0下载:
  2. 本文阐述了一个基于K-Nearest Neighbor(KNN)算法的中文网页自动分类系统的体系结构、具体设计和实现过程。系统分成三个模块:中文网页的下载与过滤(王勋完成);KNN算法的训练与分类(黄健完成);算法评估以及分词系统的整合(吴亮完成)。 本人主要是实现算法的评估以及分词系统的整合:分词系统的整合利用爱博汉语分词系统(服务器版本—共享版),将下载下来的中文网页过滤后所得到的txt文件内容进行分词,以便提供给KNN算法进行训练和分类;算法的评估是将KNN算法后所得到的结果进行分析,
  3. 所属分类:Delphi VCL

    • 发布日期:2017-03-23
    • 文件大小:622142
    • 提供者:吴亮
  1. Frequency-Estimates-Word-Similarity-

    0下载:
  2. 统计分词的相似性措施的频率估计 ,词汇相似性的频率算法。-Ourbestcombinationofsimilaritymea-sureandfrequencyestimationmethodanswers 6-8 morequestionsthan the bestresultspre-viouslyreportedforthesamequestionsets.
  3. 所属分类:Java Develop

    • 发布日期:2017-05-02
    • 文件大小:616312
    • 提供者:xz
  1. WordSeg

    0下载:
  2. 这是一个分词程序,有正向最大匹配算法,逆向最大匹配算法,正向最小匹配算法。-This is a word segmentation program, there are positive maximal matching algorithm, reverse maximal matching algorithm, positive minimum matching algorithms.
  3. 所属分类:Windows Develop

    • 发布日期:2017-04-03
    • 文件大小:491470
    • 提供者:guizhongyun
  1. seg

    0下载:
  2. C# 中文分词 基于统计的朴素贝叶斯算法-C# ChineseWordSeg
  3. 所属分类:.net

    • 发布日期:2017-03-29
    • 文件大小:3341
    • 提供者:zhang
« 1 2 ... 6 7 8 9 10 1112 13 14 15 »
搜珍网 www.dssz.com