搜索资源列表
java_ictclas
- 中科院计算所一博士在ictclas基础上改写的java调用接口,有demo有使用说明
WordSpli
- 基于ictclas的中文分词系统在Eclipse3.3中的使用例子
fenci_ICTCLAS
- 基于中科院计算所的ICTCLAS系统开发的分词工具,只有一个类,上手最快,功能强大
FreeICTCLAS
- 中科院的汉语词法分析系统ICTCLAS,主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。
中文网页自动分类器
- 利用knn算法实现了一个中文网页自动分类器, 包括网页预处理,ictclas中文分词,基于tf-idf的文本特征表示,基于df的特征选取和基于knn的分类算法,最后通过struts2框架web发布
ICTPOS3.0.rar
- 中科院中文分词程序ICTCLAS的汉语词性标记集,Chinese word segmentation procedure, Chinese Academy of Sciences of the Chinese part of speech tag ICTCLAS Set
ICTCLAS50_Windows_64_C
- 中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上,研制了汉语词法分析系统ICTCLAS(Institute of Computing Technology,Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典;支持繁体中文;支持gb2312、GBK、UTF8等多种编码格式。 ICTCLAS分词速度单机500KB/s,分词精度98.45 ,API不超过100kb,各种词典
FreeICTCLAS
- 中科院自动化所的ICTCLAS,C++编写。用于中文文本分词-Automation of the Chinese Academy of Sciences ICTCLAS, C++ to prepare. For the Chinese text word segmentation
C-bianyi
- 一个完整的关于c-的编译器,包含词法分析和语法分析。-On a complete c-compiler, including lexical analysis and syntax analysis.
FreeICTCLASLinux
- 中科院ICTCLAS中文分词库,linux开源版-open source ICTCLA
ICTCLAS50_Windows_32_C
- ICTCLAS_5.0中文分词库,有中科院开发。目前最好的中文分词系统,此为最新版。 -ICTCLAS 5.0 for Windows(32 bits)
IR_Lib
- XPDF:把pdf文档转化为TEXT文档的库,如需中文支持,请到官方网站下载中文语言包 HTM2TXT:把HTML文件转化为TEXT文件的库 ICTCLAS:对中文字符串进行分词的库 PS2TXT:把Postscr ipt文件转化为TEXT文件的源码-XPDF: the pdf file into a TEXT document library, for Chinese language support, please visit the official website to do
imdict-chinese-analyzer
- imdict-chinese-analyzer 是 imdict智能词典 的智能中文分词模块,算法基于隐马尔科夫模型(Hidden Markov Model, HMM),是中国科学院计算技术研究所的ictclas中文分词程序的重新实现(基于Java),可以直接为lucene搜索引擎提供简体中文分词支持。-imdict-chinese-analyzer is a smart imdict Chinese Dictionary smart module segmentation algorithm
ICTCLAS2009api
- 中科院ICTCLAS接口,对名字识别能力很强。-Chinese Academy of Sciences ICTCLAS interface, on a very strong name recognition.
study_on_ICTCLAS
- 基于多层隐马模型的汉语词法分析系统ICTCLAS的学习笔记-study on ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System
keyword(1)
- 用来自动生成一段文字的关键字,根据中科院的ICTCLAS的分词系统-keywords
ICTCLAS2010CSharpDemo
- 中文分词源程序, 中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级6次,目前已经升级到了ICTCLAS3.0。ICTCLAS3.0分词速度单机996KB/s,分词精度98.45
VC2010
- VC调用中科院分词2010版组件的最新源码! 中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级8次,目前已经升级到了ICTCLAS2010!-VC call to Word 2010 version of t
windows_c_32
- 中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级6次,目前已经升级到了ICTCLAS3.0。ICTCLAS3.0分词速度单机996KB/s,分词精度98.45 ,API不超过2
ICTCLASchinesewordsegmentation
- 中文词法分析是中文信息处理的基础与关键,中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS主要功能包括中文分词-Chinese lexical analysis is the basis for Chinese information processing and key, Chinese Academy of Sciences Institute of Computing Technology, the accumulation of years of