搜索资源列表
Chinese-text-categorization-Study
- 本文通过对Bayes、KNN、SVM 应用于中文文本分类进行比较实验研究。 应用ICTCLAS 对中文文档进行分词,在大维数,多数据情况下应用TFIDF 进行 特征选择,并同时利用它实现了对特征项进行加权处理,使文本库中的每个文本 具有统一的、可处理的结构模型。然后通过三类分类算法实现了对权值数据进行 训练和分类。-Based on the Bayes, KNN, SVM applied to compare the Chinese text ca
forictclas
- 1.在vs2008下,解压缩即可运行 2.该代码为中科院的中文分词系统ictclas源码,本人修改部分bug后上传 3.运行后输入 中文字符串就可以-1. In vs2008, the extract to run 2. The code word for the Chinese Academy of Sciences of the sub-system ictclas source, I modified some bug and upload 3. Run and enter the
ICTCLAS50_Windows_32_C
- python中文分词\ CDict.py-Chinese word python \ python Chinese word \ CDict.py
ICTCLAS5.0_API
- 详细介绍了ictclas的接口文档,主要包括c++、java以及c#-about the citclas s api,include c++\java and c#
boosting_src
- Boosting中的AdaBoost.M1算法在文本分类中的应用实现。使用ICTCLAS用于中文分词,弱分类器使用Naive Bayes。程序参数使用配置文件的格式。-Application of text classification using AdaBoost.M1. Use ICTCLAS tool in Chinese segment, and use Naive Bayes as the weak classifier. use the config file as the para
ICTCLAS50_Windows_32_JNI
- 中文分词的java代码实现,包含详细的使用方法。-Chinese Word of the java implementation
fenci
- 中文分词软件,JAVA源码,利用中科院ICTCLAS实现分词。-chinese words cut
Bayes
- 这是一个利用C#编写的贝叶斯中文文本分类器,分词器使用了ICTCLAS分词器。-failed to translate
c
- ICTCLAS2009的汉语词性标记集,详细列出了ICTCLAS中的标注分类-ICTCLAS2009 Chinese part-of-speech tags set, a detailed list of the ICTCLAS mark classification
ICTCLAS50_Windows_32_C
- 中科院分析系统 ICTCLAS的主要功能有:中文分词;词性标注;命名实体识别;新闻识别;用户词典-ICTCLAS segementword
CsegmentICTCLh
- 汉语词法分析系统ICTCLAS windows版本,我将FreeIICTCLASLinux移植到windows下,开发环境VS2005 -Chinese Lexical Analysis System ICTCLAS windows version, I will FreeIICTCLASLinux transplantation to the windows development environment VS2005
ICTCLAS50_Windows_32_C
- 中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。-New word of the Chinese Academy of Sciences Institute of Computing Technology, Chinese Lexical Ana
ICTCLAS2012
- ICTCLAS的最新版本2012. 1.增加了CICTCLAS部分函数 2.修正了部分再UTF-8下计算位移偏移量的Bug. 3.ICTCLAS完全兼容开源搜索引擎Sphinx,具体可以访问Sphinx官网; 4.为保障用户使用的便利,从本版开始,调用的dll的名称一律为ICTCLAS2011.dll,不再变化,一般用户只需要变更dll及对应的.user授权文件,无需重新编译自己的程序,即可兼容新版本分词程序。 -ICTCLAS the latest version 2
splitewords
- 在对话框中,调用第三方分词工具(ICTCLAS中文分词免费版),实现对中文的分词示例程序,可以对想实现全文搜索算法的中文分词问题提供解决方案。-In the dialog box, call the third-party segmentation tools (word ICTCLAS Chinese free version), the sample program to achieve the segmentation of Chinese text search algorithms C
ChineseStemming
- 采用中科院ICTCLAS分词系统对中文文本进行分词-Preprocessing Chinese text based on ICTCLAS
ICTCLAS-V3.0
- 本程序是是汉语文本的分词系统,进行了改进,是最新的版本,准确率达到99 以上。-This procedure is the Chinese text segmentation system has been improved, is the latest version, the accuracy rate of more than 99 .
Java-ICTCLAS
- java版中国科学院张华平博士的分词程序,开源java代码,仅供学习使用。国际评测很高,国内第一-java version of the Chinese Academy of Sciences, Dr. Zhang Huaping segmentation procedure, open source java code for educational purposes only. The international evaluation high, the first domestic
windows_JNI_32
- 中国科学院计算 所的 ICTCLAS系统分词正确率高达 97. ...印刷体汉字识别软件主要由中科院自动化所等研 制 ,能够支持多种硬件-Institute of Computing ICTCLAS word accuracy rate of up to 97 .... printed Chinese character recognition software, developed by the Chinese Academy of Sciences Institute of Automat
python-ictclas
- 运用python编写的中文分词,运行try文件并将路径改变就可以实现中文分词 中文存储在txt文档中-Use python to write the Chinese word, you can run try to change file and path to achieve the Chinese word Chinese storage txt document
Text-Classification_libSVM
- 用seg进行分词 输入参数一:输入文本语料所在的文件夹路径。 如 文本文件语料都放在 train//text 文件夹下,则参数为:train//text//* 。 注意:必须每篇文章在一个txt文本中。 输入参数二:输入存储分词后的结果文件所在的文件夹路径:如:result//text。注意:不需要加* 本工具采用了中科院的中文分词工具,ICTCLAS,请自行到ICTCLAS官网下载该工具。并把Data文件夹,Configure.xml,ICTCLAS30.h,ICTCLAS3