搜索资源列表
ChineseSplitter
- ChineseSplitter中文分词系统集成了单字(一元切分)、双字(二元切分)、词义切分等分词方法。提供很好的权重计算办法。-ChineseSplitter Chinese word segmentation system integrates a word (a cut), double word (Binary Segmentation), meaning cut points decile word. Weights provide a good method of calculat
smallseg_0.6.tar
- 一个简单的中文分词系统的原代码,实现了基于language model的分词逻辑-word segment
class
- 使用中科院分词系统和林智仁的libsvm进行设计的系统,主要使用java语言进行开发,其他更多的信息查看readme文件-The use of Chinese Academy of Sciences segmentation system and Lin Zhiren libsvm design system, the main use of Java language for the development of other more information, see the readme f
MyICTCLASNew
- 用java写的中文分词系统,绝对能用,欢迎下载-Chinese word segmentation :java
WordTest
- 本文阐述了一个基于K-Nearest Neighbor(KNN)算法的中文网页自动分类系统的体系结构、具体设计和实现过程。系统分成三个模块:中文网页的下载与过滤(王勋完成);KNN算法的训练与分类(黄健完成);算法评估以及分词系统的整合(吴亮完成)。 本人主要是实现算法的评估以及分词系统的整合:分词系统的整合利用爱博汉语分词系统(服务器版本—共享版),将下载下来的中文网页过滤后所得到的txt文件内容进行分词,以便提供给KNN算法进行训练和分类;算法的评估是将KNN算法后所得到的结果进行分析,
ICTCLAS2012-SDK-0101
- 这是一个分词系统,大家可以用来对文本或者一段话进行分词!具体可以访问,北京理工大学自然语言处理网www.plnir.org-This is a segmentation system, we can use the text or paragraph word! Concrete can be accessed, Beijing Institute of Technology Natural Language Processing Network www.plnir.org
sphider-1.3.5Chris
- sphider是一个开源的轻量级php+mysql全文搜索引擎,带蜘蛛功能,但是对中文支持不友好。 本版本对后台界面进行了汉化,并且对编码及数据库进行了utf8编码统一,完美解决中文乱码问题。 同时应用scws分词系统解决中文分词问题,并修正了中文搜索时不能正确返回信息的bug。 是搜索引擎开发入门的理想之选。-sphider is an open source lightweight php mysql full-text search engine, with the spider fu
ICTCLAS50_Windows_64_JNI
- 中科院权威分词系统源码,ICTCLAS50_Windows_64_JNI-ICTCLAS50_Windows_64_JNI,coming from The Chinese Academy of Sciences Authority origin code
WordSeg
- 此系统是用MFC编写的正向最大匹配的汉语分词系统,代码详尽,经本人调试能运行且正确。-The system is written in MFC forward maximum matching Chinese word segmentation system, a detailed source, I debug run and correct.
SplitWords
- 中文分词系统,给定一个文档,生成另一个内容已经被分割的文档-The Chinese word segmentation system, given a document, generating another content has been the division of the document
ICTCLAS
- ICTClAS分词系统是由中科院计算所的张华平、刘群所开发的一套获得广泛好评的分词系统,难能可贵的是该版的Free版开放了源代码,该文档是对ICTClAS分词系统的详细介绍。-ICTClAS segmentation system by the Hua-Ping Zhang from the Chinese Academy of Sciences, received wide acclaim Qun developed a word segmentation system, it is valu
TestWordSegment
- 功能组件,是分词系统的核心类 处理中文语句分词-Functional components, segmentation Segmentation System core classes deal with Chinese statement
ChineseStemming
- 采用中科院ICTCLAS分词系统对中文文本进行分词-Preprocessing Chinese text based on ICTCLAS
ICTCLAS-V3.0
- 本程序是是汉语文本的分词系统,进行了改进,是最新的版本,准确率达到99 以上。-This procedure is the Chinese text segmentation system has been improved, is the latest version, the accuracy rate of more than 99 .
WordsDividing
- 这是一个自己写的分词系统,主要用到的算法有最大前向匹配算法和最大熵。-This is a written word segmentation system, mainly used maximum forward matching algorithm and maximum entropy algorithm.
ICTCLAS_Demo
- 该程序用于短信过滤分析,首先使用ICTCLAS分词系统对输入短信进行分词,接着使用贝叶斯算法分析训练模型。最后对测试集中的短信进行垃圾短信预测。由于短信涉及个人隐私,使用时请自行添加训练数据集和测试数据集-The procedures used for SMS filtering analysis, the first to use the segmentation the ICTCLAS segmentation system input SMS, then use a Bayesian al
hlssplit
- hlssplit分词系统,使用C++编写,提供java接口,非常好用的分词工具,严重推荐!-the hlssplit word system written using the C++, java interface, very easy to use segmentation tools seriously recommend!
friso-dict-src-0.1
- 中文分词系统,用来进行分词的源代码,可供我们调用的函数。-Chinese word segmentation system, used for the segmentation of the source code, we can call function.
chinese-analyzer
- 基于中科院的分词系统修改的java版的中文分词系统-CAS-term system based on the modified version of java Chinese word segmentation system
Win-32bit-JNI-lib
- java实现的NLPIR汉语分词系统源代码-java implementation NLPIR Chinese word segmentation system source code