CDN加速镜像 | 设为首页 | 加入收藏夹
当前位置: 首页 资源下载 搜索资源 - 分词系统

搜索资源列表

  1. 汉语分词统计

    0下载:
  2. 分词,针对汉语的分词,根据统计来实现的,可以直接使用目录即可,里面针对联合早报进行的测试,分次统计中可以包括任意目录(系统能承受得了就行),这是帮一个同学做的作业:)用asp。net + xml
  3. 所属分类:C#编程

    • 发布日期:2008-10-13
    • 文件大小:43382
    • 提供者:中国
  1. 词库 zwcksc30

    0下载:
  2. 分词系统的补充数据库,对于不同的领域有不同的数据库。-Word of the database system and for different areas have different databases.
  3. 所属分类:Windows编程

    • 发布日期:2008-10-13
    • 文件大小:3993769
    • 提供者:andy
  1. FreeICTCLAS.rar

    0下载:
  2. 汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),该系统的功能有:中文分词;词性标注;未登录词识别。分词正确率高达97.58 (973专家组评测),未登录词识别召回率均高于90 ,其中中国人名的识别召回率接近98 处理速度为31.5Kbytes/s。ICTCLAS的特色还在于:可以根据需要输出多个高概率结果,有多种输出格式,支持北大词性标注集,973专家组给出的词性标注集合。该系
  3. 所属分类:Other systems

    • 发布日期:2017-05-16
    • 文件大小:4435192
    • 提供者:lwl
  1. segmentation

    0下载:
  2. 基于hashmap的首字哈希查找法,正向最大匹配法分词系统。代码用c++编写,本系统很好的实现了分词功能。-Based on the first word hash hashmap Find law, being the largest sub-word matching system. Code using c++ development, the system achieved a very good word function.
  3. 所属分类:MultiLanguage

    • 发布日期:2017-05-12
    • 文件大小:3018678
    • 提供者:杨小鹏
  1. ICTCLAS

    0下载:
  2. 计算所汉语词法分析系统ICTCLAS.分词正确率高达97.58%(973专家组评测),未登录词识别召回率均高于90%,其中中国人名的识别召回率接近98%处理速度为31.5Kbytes/s。ICTCLAS的特色还在于:可以根据需要输出多个高概率结果,有多种输出格式,支持北大词性标注集,973专家组给出的词性标注集合。-Calculate the Chinese Lexical Analysis System ICTCLAS. Segmentation correct rate of 97.58 p
  3. 所属分类:Compiler program

    • 发布日期:2017-11-09
    • 文件大小:3140411
    • 提供者:站长
  1. ICTCLAS

    0下载:
  2. 中科院分词系统VC++版本,在VS2005下编译通过,含有所有源代码,可以保证在中科院算法上,自己添加新的想法,或者对已有的算法进行优化。-Word Segmentation System, Chinese Academy of Sciences VC++ version at compile under VS2005 passed, containing all the source code, algorithms can guarantee at the Chinese Academy o
  3. 所属分类:MultiLanguage

    • 发布日期:2017-05-28
    • 文件大小:11756188
    • 提供者:吴晓明
  1. Source_Code

    0下载:
  2. 中文分词系统分析库,可以对UTF8表述的中文文字进行分词操作, 支持外挂的词库和手动干预(回调方式)的加权处理。 可用于搜索引擎的基础分词开发-Chinese word segmentation system analysis libraries, can be expressed UTF8 Chinese text segmentation operation, support plug and manual intervention in the thesaurus (callback me
  3. 所属分类:MultiLanguage

    • 发布日期:2017-03-29
    • 文件大小:112926
    • 提供者:jeff
  1. css

    0下载:
  2. 用VISUAL C++编写的中文分词系统C-Using VISUAL C++ Prepared Chinese word segmentation system C
  3. 所属分类:Search Engine

    • 发布日期:2017-04-03
    • 文件大小:37365
    • 提供者:zsl
  1. include

    0下载:
  2. 用VISUAL C++编写的中文分词系统中的INCULDE算法-Using VISUAL C++ Prepared Chinese word segmentation system INCULDE algorithm
  3. 所属分类:Search Engine

    • 发布日期:2017-04-01
    • 文件大小:36158
    • 提供者:zsl
  1. utils

    0下载:
  2. 用VISUAL C++编写的中文分词系统 UTILS算法-Using VISUAL C++ Prepared Chinese word segmentation system Utils algorithm
  3. 所属分类:Search Engine

    • 发布日期:2017-03-29
    • 文件大小:24620
    • 提供者:zsl
  1. zhishifencisuanfa

    0下载:
  2. 基于知识分词算法的病案全文检索系统, 硕士论文.-Knowledge-based segmentation algorithm cases full-text retrieval system, a master s thesis.
  3. 所属分类:File Formats

    • 发布日期:2017-05-12
    • 文件大小:2978537
    • 提供者:小段
  1. ir

    0下载:
  2. 本系统实现了分词和倒排索引,分词采用正向最大匹配,-The system achieved a sub-word and the inverted index, the biggest being the use of sub-word match,
  3. 所属分类:MultiLanguage

    • 发布日期:2017-05-12
    • 文件大小:1354082
    • 提供者:刘风
  1. sharpictclas

    0下载:
  2. 中科院分词系统的CSharp版,采用隐马尔科夫模型,识别率非常高-Word Segmentation System, Chinese Academy of Sciences CSharp version
  3. 所属分类:CSharp

    • 发布日期:2017-05-09
    • 文件大小:1917467
    • 提供者:xjj
  1. ictclaszyfc-v2009

    0下载:
  2. 中科院分词系统,包含添加词汇、统计词频等。-Chinese Academy of Sciences segmentation system, including adding vocabulary, word frequency and other statistics.
  3. 所属分类:Other windows programs

    • 发布日期:2017-05-29
    • 文件大小:11604448
    • 提供者:许锐敏
  1. maxseg

    0下载:
  2. 最大匹配分词系统,分词中最见大的,效果也是很好的系统。-maximum matching segmentation
  3. 所属分类:Other systems

    • 发布日期:2017-04-12
    • 文件大小:847
    • 提供者:quan
  1. keyword-chouqu

    0下载:
  2. 基于逆向最大匹配算法的分词及基于HMM模型的词性标注系统,包括了未登录词的识别、数据库的添加等内容。(需要手动修改数据库的路径才可以运行)-Reverse Maximum Matching Algorithm Based on the sub-word HMM-based model and part of speech tagging system, including the unknown word identification, such as the contents of the d
  3. 所属分类:MultiLanguage

    • 发布日期:2017-05-04
    • 文件大小:1259447
    • 提供者:张莉娟
  1. softwarecode

    0下载:
  2. 中文分词是中文信息处理中的重要环节,中文分词技术广泛应用于自动翻译、文本检索、语音识别、文本校对、人工智能以及搜索引擎技术等领域。中文分词算法的选择,中文词库的构建方式,词库中词条的完备性在很大程度上与中文分词系统性能紧密相关。-Chinese word segmentation in Chinese information processing is an important part of Chinese word segmentation technology is widely used
  3. 所属分类:AI-NN-PR

    • 发布日期:2017-03-27
    • 文件大小:911314
    • 提供者:李东升
  1. KeyWordTree

    0下载:
  2. 一个c#编写的中文分词系统,有一个附带的baidu词库-fen ci c#
  3. 所属分类:MultiLanguage

    • 发布日期:2017-03-28
    • 文件大小:365355
    • 提供者:张宝华
  1. SharpICTCLAS

    0下载:
  2. ICTCLAS分词的总体流程包括:1)初步分词;2)词性标注;3)人名、地名识别;4)重新分词;5)重新词性标注这五步。就第一步分词而言,又细分成:1)原子切分;2)找出原子之间所有可能的组词方案;3)N-最短路径中文词语粗分三步。 在所有内容中,词典库的读取是最基本的功能。ICTCLAS中词典存放在Data目录中,常用的词典包括coreDict.dct(词典库)、BigramDict.dct(词与词间的关联库)、nr.dct(人名库)、ns.dct(地名库)、tr.dct(翻译人名库
  3. 所属分类:Search Engine

    • 发布日期:2017-04-09
    • 文件大小:1964863
    • 提供者:ounata
  1. paoding-analysis-2.0.4-beta

    0下载:
  2. paoding-dic-home.properties是庖丁解牛中文分词的配置文件 庖丁解牛分词器是基于lucene的中文分词系统的软件。(Paoding-dic-home.properties is Chinese Paodingjieniu participle configuration file Is Chinese Paodingjieniu segmentation segmentation system based on the Lucene software.)
  3. 所属分类:网络编程

    • 发布日期:2018-04-21
    • 文件大小:6108160
    • 提供者:Alex灬XiaoD
« 1 23 4 5 6 7 8 9 10 »
搜珍网 www.dssz.com