搜索资源 - 分词； - 搜珍网

CDN加速镜像 | 设为首页 | 加入收藏夹

热门搜索： 源码 Android 整站插件识别 p2p OpenCV 网络编程游戏源码算法更多...

登陆 | 会员注册

当前位置：

搜索资源 - 分词；

下载资源主分类

源码下载

Web源码

开发工具

文档下载

其它资源

资源分类

搜索资源列表

ictclas_Source_Code

0下载：
计算所汉语词法分析系统ICTCLAS介绍词是最小的能够独立活动的有意义的语言成分。但汉语是以字为基本的书写单位，词语之间没有明显的区分标记，因此，中文词语分析是中文信息处理的基础与关键。为此,我们中国科学院计算技术研究所在多年研究基础上，耗时一年研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System)，该系统的功能有：中文分词；词性标注；未登录词识别。分词正确率高达97
所属分类：中文信息处理
- 发布日期：2008-10-13
- 文件大小：113239
- 提供者：郑昀

firtex_beta102_src

0下载：
FirteX介绍功能：支持增量索引，差量索引，多字段索引，提供了3种前向索引方式；支持纯文本，HTML，PDF等文件格式；提供快速中文分词；从底层到高层，提供了多种索引访问接口，灵活自由地使用索引文件；提供丰富的检索语法，支持多字段检索，日期范围检索，检索结果自定义排序等。性能：在Pentium 4 2.8G 2GRAM的机器上超过200Mb每分钟的索引速度在近7G的索引文件（100G网页，11G纯文本的索引）上检索，仅使用十几M内存在数毫
所属分类：搜索引擎
- 发布日期：2008-10-13
- 文件大小：13796524
- 提供者：阮正

FreeICTCLAS

1下载：
中科院的汉语词法分析系统ICTCLAS,主要功能包括中文分词；词性标注；命名实体识别；新词识别；同时支持用户词典。
所属分类：中文信息处理
- 发布日期：2008-10-13
- 文件大小：3091976
- 提供者：xuli

ICTCLAS2009.对中文进行分词并对其词性标注

1下载：
对中文进行分词并对其词性标注；命名实体识别；新词识别；同时支持用户词典,To be conducted in Chinese word segmentation and POS tagging Named Entity Recognition new word identification simultaneously support the user dictionary
所属分类：软件工程
- 发布日期：2016-04-13
- 文件大小：55702
- 提供者：ictclas

FreeICTCLAS.rar

0下载：
汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System)，该系统的功能有：中文分词；词性标注；未登录词识别。分词正确率高达97.58 (973专家组评测)，未登录词识别召回率均高于90 ，其中中国人名的识别召回率接近98 处理速度为31.5Kbytes/s。ICTCLAS的特色还在于：可以根据需要输出多个高概率结果，有多种输出格式，支持北大词性标注集，973专家组给出的词性标注集合。该系
所属分类：Other systems
- 发布日期：2017-05-16
- 文件大小：4435192
- 提供者：lwl

windowsC32.rar

0下载：
汉语词法分词系统，主要功能包括中文分词；词性标注；命名实体识别；新词识别；同时支持用户词典。,Morphology of Chinese word segmentation systems, the main features include Chinese word segmentation-of-speech tagging named entity recognition new word identification At the same time support the use
所属分类：Windows Develop
- 发布日期：2017-05-27
- 文件大小：10136238
- 提供者：panda

ICTCLAS50_Windows_64_C

0下载：
中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上，研制了汉语词法分析系统ICTCLAS（Institute of Computing Technology,Chinese Lexical Analysis System），主要功能包括中文分词；词性标注；命名实体识别；新词识别；同时支持用户词典；支持繁体中文；支持gb2312、GBK、UTF8等多种编码格式。 ICTCLAS分词速度单机500KB/s，分词精度98.45 ，API不超过100kb，各种词典
所属分类：CSharp
- 发布日期：2017-05-26
- 文件大小：9239317
- 提供者：huangfei

Bayes_1

1下载：
首先，对CATEGORY中的txt文件分类；其次，对多个txt文件中的英文文本进行分词；最后，通过贝叶斯公式进行分类；-First, in the txt file CATEGORY classification Secondly, multiple txt files in English text word Finally, by Bayes formula to be classified
所属分类：Algorithm
- 发布日期：2017-04-03
- 文件大小：411491
- 提供者：guangyu

WordFrequencyStatistics

0下载：
字频统计，根据词库实现汉字分词，效果不错；另外还能够统计出汉字词出现的频率；-Word frequency statistics, according to Chinese characters thesaurus, word, In addition to the Chinese characters of statistics.
所属分类：CSharp
- 发布日期：2017-04-08
- 文件大小：240222
- 提供者：zhu clay

SharpICTCLAS

0下载：
ICTCLAS分词的总体流程包括：1）初步分词；2）词性标注；3）人名、地名识别；4）重新分词；5）重新词性标注这五步。就第一步分词而言，又细分成：1）原子切分；2）找出原子之间所有可能的组词方案；3）N-最短路径中文词语粗分三步。在所有内容中，词典库的读取是最基本的功能。ICTCLAS中词典存放在Data目录中，常用的词典包括coreDict.dct（词典库）、BigramDict.dct（词与词间的关联库）、nr.dct（人名库）、ns.dct（地名库）、tr.dct（翻译人名库
所属分类：Search Engine
- 发布日期：2017-04-09
- 文件大小：1964863
- 提供者：ounata

windows_csharp_32

1下载：
中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上，研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System)，主要功能包括中文分词；词性标注；命名实体识别；新词识别；同时支持用户词典。ICTCLAS全部采用C/C++编写，支持Linux、FreeBSD及Windows系列操作系统，支持C/C++/C#/Delphi/Java等主流的开发语言
所属分类：CSharp
- 发布日期：2016-02-05
- 文件大小：6507593
- 提供者：火山

ICTCLAS2010CSharpDemo

0下载：
中文分词源程序，　中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上，研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System)，主要功能包括中文分词；词性标注；命名实体识别；新词识别；同时支持用户词典。我们先后精心打造五年，内核升级6次，目前已经升级到了ICTCLAS3.0。ICTCLAS3.0分词速度单机996KB/s，分词精度98.45
所属分类：Search Engine
- 发布日期：2017-03-30
- 文件大小：93050
- 提供者：Liuying

VC2010

0下载：
VC调用中科院分词2010版组件的最新源码！中国科学院计算技术研究所在多年研究工作积累的基础上，研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System)，主要功能包括中文分词；词性标注；命名实体识别；新词识别；同时支持用户词典。我们先后精心打造五年，内核升级8次，目前已经升级到了ICTCLAS2010！-VC call to Word 2010 version of t
所属分类：Compiler program
- 发布日期：2017-05-23
- 文件大小：7228362
- 提供者：胡名

windows_c_32

0下载：
中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上，研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System)，主要功能包括中文分词；词性标注；命名实体识别；新词识别；同时支持用户词典。我们先后精心打造五年，内核升级6次，目前已经升级到了ICTCLAS3.0。ICTCLAS3.0分词速度单机996KB/s，分词精度98.45 ，API不超过2
所属分类：Compiler program
- 发布日期：2017-05-27
- 文件大小：10333913
- 提供者：陈蓉

ICTCLAS

0下载：
中国科学院计算技术研究所在多年研究工作积累的基础上，研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System)，主要功能包括中文分词；词性标注；命名实体识别；新词识别；同时支持用户词典。我们先后精心打造五年，内核升级7次，目前已经升级到了ICTCLAS2009。-Institute of Computing Technology, Chinese Academy of resear
所属分类：Other windows programs
- 发布日期：2017-05-16
- 文件大小：4450642
- 提供者：huyunfei

ICTCLAS50_Windows_32_C

0下载：
中科院分析系统 ICTCLAS的主要功能有：中文分词；词性标注；命名实体识别；新闻识别；用户词典-ICTCLAS segementword
所属分类：Search Engine
- 发布日期：2017-05-26
- 文件大小：9088625
- 提供者：yaling

ICTCLAS50_Windows_32_C

0下载：
中国科学院计算技术研究所在多年研究工作积累的基础上，研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System)，主要功能包括中文分词；词性标注；命名实体识别；新词识别；同时支持用户词典。-New word of the Chinese Academy of Sciences Institute of Computing Technology, Chinese Lexical Ana
所属分类：Other systems
- 发布日期：2017-11-11
- 文件大小：10638336
- 提供者：徐颖

Nlpir

0下载：
前NLPIR汉语分词系统(又名ICTCLAS2013),主要功能包括中文分词；词性标注；命名实体识别；用户词典功能；支持GBK编码、UTF8编码、BIG5编码。新增微博分词、新词发现与关键词提取；张华平博士先后倾力打造十余年，内核升级10次。国内国际排名均为第一。项目已经配置好环境，导入Eclipse即可使用，文件内src下的TestUTF8.java可以直接运行，提供了分词接口-Before NLPIR Chinese word segmentation system (aka I
所属分类：Java Develop
- 发布日期：2017-05-17
- 文件大小：4858592
- 提供者：reacher

chinese_seg_update

0下载：
中文分词，采用逆向最大匹配方法实现，利用字典作为索引(The Chinese word segmentation is realized by the reverse maximum matching method, and the dictionary is used as the index.)
所属分类：其他
- 发布日期：2018-04-30
- 文件大小：1583104
- 提供者：meizu

icwb2-data

1下载：
中文分词数据，含有as、 cityu、msr、pku数据，包括测试集、训练集(Chinese word segmentation data)
所属分类：文章/文档
- 发布日期：2020-03-28
- 文件大小：48031744
- 提供者：万俟洛

« 12 3 »

搜珍网 www.dssz.com

本网站为编程资源及源代码搜集、介绍的搜索网站，版权归原作者所有！　　粤ICP备11031372号

1999-2046 搜珍网 All Rights Reserved.