搜索资源列表
fenci
- 中文分词软件,JAVA源码,利用中科院ICTCLAS实现分词。-chinese words cut
Bayes
- 这是一个利用C#编写的贝叶斯中文文本分类器,分词器使用了ICTCLAS分词器。-failed to translate
ICTCLAS2012-SDK-0101
- 这是一个分词系统,大家可以用来对文本或者一段话进行分词!具体可以访问,北京理工大学自然语言处理网www.plnir.org-This is a segmentation system, we can use the text or paragraph word! Concrete can be accessed, Beijing Institute of Technology Natural Language Processing Network www.plnir.org
c
- ICTCLAS2009的汉语词性标记集,详细列出了ICTCLAS中的标注分类-ICTCLAS2009 Chinese part-of-speech tags set, a detailed list of the ICTCLAS mark classification
ICTCLAS50_Windows_32_C
- 中科院分析系统 ICTCLAS的主要功能有:中文分词;词性标注;命名实体识别;新闻识别;用户词典-ICTCLAS segementword
ictclas4j
- ictclas进行文本词汇标注,可直接运行 主函数在postag类-ictlas word pos tag
CsegmentICTCLh
- 汉语词法分析系统ICTCLAS windows版本,我将FreeIICTCLASLinux移植到windows下,开发环境VS2005 -Chinese Lexical Analysis System ICTCLAS windows version, I will FreeIICTCLASLinux transplantation to the windows development environment VS2005
ICTCLAS50_Windows_32_C
- 中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。-New word of the Chinese Academy of Sciences Institute of Computing Technology, Chinese Lexical Ana
ICTCLAS2012
- ICTCLAS的最新版本2012. 1.增加了CICTCLAS部分函数 2.修正了部分再UTF-8下计算位移偏移量的Bug. 3.ICTCLAS完全兼容开源搜索引擎Sphinx,具体可以访问Sphinx官网; 4.为保障用户使用的便利,从本版开始,调用的dll的名称一律为ICTCLAS2011.dll,不再变化,一般用户只需要变更dll及对应的.user授权文件,无需重新编译自己的程序,即可兼容新版本分词程序。 -ICTCLAS the latest version 2
ansj_seg-master
- 这是一个ictclas的java实现.基本上重写了所有的数据结构和算法.词典是用的开源版的ictclas所提供的.并且进行了部分的人工优化 内存中中文分词每秒钟大约100万字(速度上已经超越ictclas) 文件读取分词每秒钟大约30万字 准确率能达到96 以上-This is a ictclas of java. Basically rewrite all the data structures and algorithms. Dictionary is prov
splitewords
- 在对话框中,调用第三方分词工具(ICTCLAS中文分词免费版),实现对中文的分词示例程序,可以对想实现全文搜索算法的中文分词问题提供解决方案。-In the dialog box, call the third-party segmentation tools (word ICTCLAS Chinese free version), the sample program to achieve the segmentation of Chinese text search algorithms C
ChineseStemming
- 采用中科院ICTCLAS分词系统对中文文本进行分词-Preprocessing Chinese text based on ICTCLAS
ICTCLAS-V3.0
- 本程序是是汉语文本的分词系统,进行了改进,是最新的版本,准确率达到99 以上。-This procedure is the Chinese text segmentation system has been improved, is the latest version, the accuracy rate of more than 99 .
Java-ICTCLAS
- java版中国科学院张华平博士的分词程序,开源java代码,仅供学习使用。国际评测很高,国内第一-java version of the Chinese Academy of Sciences, Dr. Zhang Huaping segmentation procedure, open source java code for educational purposes only. The international evaluation high, the first domestic
ICTCLAS_Demo
- 该程序用于短信过滤分析,首先使用ICTCLAS分词系统对输入短信进行分词,接着使用贝叶斯算法分析训练模型。最后对测试集中的短信进行垃圾短信预测。由于短信涉及个人隐私,使用时请自行添加训练数据集和测试数据集-The procedures used for SMS filtering analysis, the first to use the segmentation the ICTCLAS segmentation system input SMS, then use a Bayesian al
MapTest
- 倒排索引,此程序,运用ICTClas分词工具实现的中文分词,并建立倒排索引输出到指定文件。-Inverted index, this procedure, use ICTClas segmentation tool to achieve the Chinese word segmentation and indexing inverted output to the specified file.
windows_JNI_32
- 中国科学院计算 所的 ICTCLAS系统分词正确率高达 97. ...印刷体汉字识别软件主要由中科院自动化所等研 制 ,能够支持多种硬件-Institute of Computing ICTCLAS word accuracy rate of up to 97 .... printed Chinese character recognition software, developed by the Chinese Academy of Sciences Institute of Automat
python-ictclas
- 运用python编写的中文分词,运行try文件并将路径改变就可以实现中文分词 中文存储在txt文档中-Use python to write the Chinese word, you can run try to change file and path to achieve the Chinese word Chinese storage txt document
Text-Classification_libSVM
- 用seg进行分词 输入参数一:输入文本语料所在的文件夹路径。 如 文本文件语料都放在 train//text 文件夹下,则参数为:train//text//* 。 注意:必须每篇文章在一个txt文本中。 输入参数二:输入存储分词后的结果文件所在的文件夹路径:如:result//text。注意:不需要加* 本工具采用了中科院的中文分词工具,ICTCLAS,请自行到ICTCLAS官网下载该工具。并把Data文件夹,Configure.xml,ICTCLAS30.h,ICTCLAS3
ICTCLAS
- 中科院分词工具,要运行还需要去官网上下载其他文件。 可以大概根据该文件知道API-The CAS segmentation tools to run need to download other files Quguan online. Can probably know that according to the file API