搜索资源列表
ICTCLAS50_Windows_32_C
- ICTCLAS_5.0中文分词库,有中科院开发。目前最好的中文分词系统,此为最新版。 -ICTCLAS 5.0 for Windows(32 bits)
IR_Lib
- XPDF:把pdf文档转化为TEXT文档的库,如需中文支持,请到官方网站下载中文语言包 HTM2TXT:把HTML文件转化为TEXT文件的库 ICTCLAS:对中文字符串进行分词的库 PS2TXT:把Postscr ipt文件转化为TEXT文件的源码-XPDF: the pdf file into a TEXT document library, for Chinese language support, please visit the official website to do
JAVA
- 在城市智能交通中,经常会用到最短路径的问题,比如找最佳的行车路线等,Dijkstra算法做为最经典的求解方法,为我们指明了方向.不过真正想让我了解该算法的原因是在学习ICTCLAS的N-最短路径算法。-Intelligent Transportation in the city, often used the issue of the shortest path, for example, to find the best travel routes, Dijkstra s algorithm
imdict-chinese-analyzer
- imdict-chinese-analyzer 是 imdict智能词典 的智能中文分词模块,算法基于隐马尔科夫模型(Hidden Markov Model, HMM),是中国科学院计算技术研究所的ictclas中文分词程序的重新实现(基于Java),可以直接为lucene搜索引擎提供简体中文分词支持。-imdict-chinese-analyzer is a smart imdict Chinese Dictionary smart module segmentation algorithm
ICTCLAS2009api
- 中科院ICTCLAS接口,对名字识别能力很强。-Chinese Academy of Sciences ICTCLAS interface, on a very strong name recognition.
study_on_ICTCLAS
- 基于多层隐马模型的汉语词法分析系统ICTCLAS的学习笔记-study on ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System
keyword(1)
- 用来自动生成一段文字的关键字,根据中科院的ICTCLAS的分词系统-keywords
ICTCLAS2010CSharpDemo
- 中文分词源程序, 中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级6次,目前已经升级到了ICTCLAS3.0。ICTCLAS3.0分词速度单机996KB/s,分词精度98.45
bin
- 中科院分词系统,非常好用的分词工具,现下比较流行,对你会有帮助的-ICTCLAS,a useful tool, it will be useful for you
VC2010
- VC调用中科院分词2010版组件的最新源码! 中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级8次,目前已经升级到了ICTCLAS2010!-VC call to Word 2010 version of t
ICTCLAS2010-packet-release
- ICTCLAS2010版本,包含c,java的接口,还有演示程序。-ICTCLAS2010 versions, c, java interface, and demonstration program.
windows_c_32
- 中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级6次,目前已经升级到了ICTCLAS3.0。ICTCLAS3.0分词速度单机996KB/s,分词精度98.45 ,API不超过2
ICTCLASchinesewordsegmentation
- 中文词法分析是中文信息处理的基础与关键,中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS主要功能包括中文分词-Chinese lexical analysis is the basis for Chinese information processing and key, Chinese Academy of Sciences Institute of Computing Technology, the accumulation of years of
Chinese-text-categorization-Study
- 本文通过对Bayes、KNN、SVM 应用于中文文本分类进行比较实验研究。 应用ICTCLAS 对中文文档进行分词,在大维数,多数据情况下应用TFIDF 进行 特征选择,并同时利用它实现了对特征项进行加权处理,使文本库中的每个文本 具有统一的、可处理的结构模型。然后通过三类分类算法实现了对权值数据进行 训练和分类。-Based on the Bayes, KNN, SVM applied to compare the Chinese text ca
ICTCLAS_JAVA
- 使用汉语分词系统ICTCLAS_JAVA版本进行中文分词、词性标注-Use of Chinese word segmentation system ICTCLAS_JAVA version of Chinese word segmentation, POS tagging
forictclas
- 1.在vs2008下,解压缩即可运行 2.该代码为中科院的中文分词系统ictclas源码,本人修改部分bug后上传 3.运行后输入 中文字符串就可以-1. In vs2008, the extract to run 2. The code word for the Chinese Academy of Sciences of the sub-system ictclas source, I modified some bug and upload 3. Run and enter the
ICTCLAS50_Windows_32_C
- python中文分词\ CDict.py-Chinese word python \ python Chinese word \ CDict.py
ICTCLAS5.0_API
- 详细介绍了ictclas的接口文档,主要包括c++、java以及c#-about the citclas s api,include c++\java and c#
boosting_src
- Boosting中的AdaBoost.M1算法在文本分类中的应用实现。使用ICTCLAS用于中文分词,弱分类器使用Naive Bayes。程序参数使用配置文件的格式。-Application of text classification using AdaBoost.M1. Use ICTCLAS tool in Chinese segment, and use Naive Bayes as the weak classifier. use the config file as the para
ICTCLAS50_Windows_32_JNI
- 中文分词的java代码实现,包含详细的使用方法。-Chinese Word of the java implementation