CDN加速镜像 | 设为首页 | 加入收藏夹
当前位置: 首页 资源下载 搜索资源 - ;中文分词

搜索资源列表

  1. ictclas_Source_Code

    0下载:
  2. 计算所汉语词法分析系统ICTCLAS介绍 词是最小的能够独立活动的有意义的语言成分。 但汉语是以字为基本的书写单位,词语之间没有明显的区分标记,因此,中文词语分析是中文信息处理的基础与关键。为此,我们中国科学院计算技术研究所在多年研究基础上,耗时一年研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),该系统的功能有:中文分词;词性标注;未登录词识别。分词正确率高达97
  3. 所属分类:中文信息处理

    • 发布日期:2008-10-13
    • 文件大小:113239
    • 提供者:郑昀
  1. firtex_beta102_src

    0下载:
  2. FirteX介绍 功能: 支持增量索引,差量索引,多字段索引,提供了3种前向索引方式; 支持纯文本,HTML,PDF等文件格式; 提供快速中文分词; 从底层到高层,提供了多种索引访问接口,灵活自由地使用索引文件; 提供丰富的检索语法,支持多字段检索,日期范围检索,检索结果自定义排序等。 性能: 在Pentium 4 2.8G 2GRAM的机器上超过200Mb每分钟的索引速度 在近7G的索引文件(100G网页,11G纯文本的索引)上检索,仅使用十几M内存在数毫
  3. 所属分类:搜索引擎

    • 发布日期:2008-10-13
    • 文件大小:13796524
    • 提供者:阮正
  1. FreeICTCLAS

    1下载:
  2. 中科院的汉语词法分析系统ICTCLAS,主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。
  3. 所属分类:中文信息处理

    • 发布日期:2008-10-13
    • 文件大小:3091976
    • 提供者:xuli
  1. 网页搜索引擎

    1下载:
  2. K-PageSearch是由Kwindsoft在2007年自主研发的专为行业、专类信息检索设计的网页搜索引擎。主要功能特点:网络蜘蛛、定向采集、正文提取、中文分词、全文索引、相关度排序、网页快照、相关搜索、竞价排名;后台数据库采用Microsoft SQL Server,静态化搜索系统设计采用XML数据岛缓存搜索结果提高系统的稳定性和性能、节省服务器资源减轻系统负担。 网络蜘蛛 K风蜘蛛组件包括三大功能模块:链接采集、网页分析、无效网页扫描; 自动识别GB2312、BIG5、UTF-8、Unic
  3. 所属分类:ASP源码

    • 发布日期:2011-04-14
    • 文件大小:716570
    • 提供者:gongcolin
  1. ICTCLAS2009.对中文进行分词并对其词性标注

    1下载:
  2. 对中文进行分词并对其词性标注;命名实体识别;新词识别;同时支持用户词典,To be conducted in Chinese word segmentation and POS tagging Named Entity Recognition new word identification simultaneously support the user dictionary
  3. 所属分类:软件工程

    • 发布日期:2016-04-13
    • 文件大小:55702
    • 提供者:ictclas
  1. FreeICTCLAS.rar

    0下载:
  2. 汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),该系统的功能有:中文分词;词性标注;未登录词识别。分词正确率高达97.58 (973专家组评测),未登录词识别召回率均高于90 ,其中中国人名的识别召回率接近98 处理速度为31.5Kbytes/s。ICTCLAS的特色还在于:可以根据需要输出多个高概率结果,有多种输出格式,支持北大词性标注集,973专家组给出的词性标注集合。该系
  3. 所属分类:Other systems

    • 发布日期:2017-05-16
    • 文件大小:4435192
    • 提供者:lwl
  1. windowsC32.rar

    0下载:
  2. 汉语词法分词系统,主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。,Morphology of Chinese word segmentation systems, the main features include Chinese word segmentation-of-speech tagging named entity recognition new word identification At the same time support the use
  3. 所属分类:Windows Develop

    • 发布日期:2017-05-27
    • 文件大小:10136238
    • 提供者:panda
  1. ICTCLAS50_Windows_64_C

    0下载:
  2. 中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上,研制了汉语词法分析系统ICTCLAS(Institute of Computing Technology,Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典;支持繁体中文;支持gb2312、GBK、UTF8等多种编码格式。 ICTCLAS分词速度单机500KB/s,分词精度98.45 ,API不超过100kb,各种词典
  3. 所属分类:CSharp

    • 发布日期:2017-05-26
    • 文件大小:9239317
    • 提供者:huangfei
  1. IKAnalyzer3.2.8-source

    0下载:
  2. IKAnalyzer的源码包,实现中文分词功能,(1) 采用了特有的“正向迭代最细粒度切分算法”,具有60万字/ 秒的高速处理能力。 (2) 采用了多子处理器分析模式,支持:英文字母( IP 地址、Email、URL )、数字(日期,常用中文数量词,罗马数字,科学计数法),中文词汇(姓名、地名处理)等分词处理 。 (3) 优化的词典存储,更小的内存占用。支持用户词典扩展定义 (4) 针对 Lucene 全文检索优化的查询分析器 IKQueryParser;采用歧义分析算法优化查询关键
  3. 所属分类:Java Develop

    • 发布日期:2017-04-09
    • 文件大小:1197198
    • 提供者:陈雅倩
  1. SharpICTCLAS

    0下载:
  2. ICTCLAS分词的总体流程包括:1)初步分词;2)词性标注;3)人名、地名识别;4)重新分词;5)重新词性标注这五步。就第一步分词而言,又细分成:1)原子切分;2)找出原子之间所有可能的组词方案;3)N-最短路径中文词语粗分三步。 在所有内容中,词典库的读取是最基本的功能。ICTCLAS中词典存放在Data目录中,常用的词典包括coreDict.dct(词典库)、BigramDict.dct(词与词间的关联库)、nr.dct(人名库)、ns.dct(地名库)、tr.dct(翻译人名库
  3. 所属分类:Search Engine

    • 发布日期:2017-04-09
    • 文件大小:1964863
    • 提供者:ounata
  1. windows_csharp_32

    1下载:
  2. 中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。ICTCLAS全部采用C/C++编写,支持Linux、FreeBSD及Windows系列操作系统,支持C/C++/C#/Delphi/Java等主流的开发语言
  3. 所属分类:CSharp

    • 发布日期:2016-02-05
    • 文件大小:6507593
    • 提供者:火山
  1. ChineseWordSegmentation1

    0下载:
  2. 中文分词-前向最大匹配方法;VS2008环境下实现-Chinese word- the former to the maximum matching method VS2008 environment to achieve
  3. 所属分类:MultiLanguage

    • 发布日期:2017-04-07
    • 文件大小:937692
    • 提供者:孙伟
  1. ICTCLAS2010CSharpDemo

    0下载:
  2. 中文分词源程序, 中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级6次,目前已经升级到了ICTCLAS3.0。ICTCLAS3.0分词速度单机996KB/s,分词精度98.45
  3. 所属分类:Search Engine

    • 发布日期:2017-03-30
    • 文件大小:93050
    • 提供者:Liuying
  1. VC2010

    0下载:
  2. VC调用中科院分词2010版组件的最新源码! 中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级8次,目前已经升级到了ICTCLAS2010!-VC call to Word 2010 version of t
  3. 所属分类:Compiler program

    • 发布日期:2017-05-23
    • 文件大小:7228362
    • 提供者:胡名
  1. windows_c_32

    0下载:
  2. 中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级6次,目前已经升级到了ICTCLAS3.0。ICTCLAS3.0分词速度单机996KB/s,分词精度98.45 ,API不超过2
  3. 所属分类:Compiler program

    • 发布日期:2017-05-27
    • 文件大小:10333913
    • 提供者:陈蓉
  1. sse4j

    0下载:
  2. SSE4J(Spatial Search Engine for Java)是针对地理信息数据源构建的垂直搜索引擎应用接口,是基于Lucene+JTS Topology Suite开源库设计的框架。 规划的SSE4J包含: 1)SSE4J应用开发包 2)SSE4J Webservice应用接口 3)SSE4J工具集 规划的SSE4J包含的功能: 1) POI搜索(名称、地址、类型等关键字搜索;周边搜索) 2)道路搜索、区域搜索 3)地址匹配、
  3. 所属分类:Java Develop

    • 发布日期:2017-03-30
    • 文件大小:484345
    • 提供者:dux
  1. ICTCLAS

    0下载:
  2. 中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级7次,目前已经升级到了ICTCLAS2009。-Institute of Computing Technology, Chinese Academy of resear
  3. 所属分类:Other windows programs

    • 发布日期:2017-05-16
    • 文件大小:4450642
    • 提供者:huyunfei
  1. ICTCLAS50_Windows_32_C

    0下载:
  2. 中科院分析系统 ICTCLAS的主要功能有:中文分词;词性标注;命名实体识别;新闻识别;用户词典-ICTCLAS segementword
  3. 所属分类:Search Engine

    • 发布日期:2017-05-26
    • 文件大小:9088625
    • 提供者:yaling
  1. chinese_seg_update

    0下载:
  2. 中文分词,采用逆向最大匹配方法实现,利用字典作为索引(The Chinese word segmentation is realized by the reverse maximum matching method, and the dictionary is used as the index.)
  3. 所属分类:其他

    • 发布日期:2018-04-30
    • 文件大小:1583104
    • 提供者:meizu
  1. icwb2-data

    1下载:
  2. 中文分词数据,含有as、 cityu、msr、pku数据,包括测试集、训练集(Chinese word segmentation data)
  3. 所属分类:文章/文档

    • 发布日期:2020-03-28
    • 文件大小:48031744
    • 提供者:万俟洛
« 12 »
搜珍网 www.dssz.com