搜索资源列表
src_seg(java)
- 一个用java语言编写的中文文本分词算法
je-analysis-1.5.3
- 在java环境下开发的分词源代码,本代码可以通过lucene,nutch调用,实现对中文的分词-Java development environment in the sub-etymology code, this code can be used with lucene, nutch call, the aim is to achieve the Chinese word
LTP
- 哈工大LTP自然语言处理工具的java调用实例,利用jni调用dll,实现中文的分词,词性标注,建立依存树等-HIT LTP natural language processing tool called an instance of java using jni call the dll, to achieve in Chinese word segmentation, POS tagging, the establishment of dependency trees, etc.
paoding_analysis
- 这是一个lucene中文索引程序,采用paoding分词器,包括建立索引和搜索过程。-This is a Chinese lucene index procedure for the segmentation paoding, including indexing and search process.
ChinesewordRate
- 统计已分词文件中中文词语出现频率,前提是要有已经完成分词的txt文件。-Statistics frequency of the Chinese word segmentation document
0nlu_project
- 本系统使用java语言编写,采用机器学习的方法进行自然语言处理,对中文进行分词和词性标注。分词采用crf模型,词性标注用hmm模型,解码算法为Vertibi算法。-The system uses java language, using machine learning methods for natural language processing, for Chinese word segmentation and POS tagging. Segmentation using crf mod
class
- 中文文本分类可以对已经分好词的文本进行分类,先自己导入数据,用libsvm中的svm进行分类和预测,特征用tfidf算法,还利用卡方检验进行了特征选择,可自行设定阈值-text mining
DeleteStopWord
- 此源码组要用于中文文本预处理。源码首先进行文本分词,分词之后对文本中的停用词进行过滤。-text preprocessing
ictclas2013_release
- ICTCLAS2013 java版,中文文本分词系统-ICTCLAS2013 java
SegDemo
- stanford分词器的使用示例,本分词器适用与中文-Example of use stanford word segment
ReadFiles
- 对中文文本进行分词,去停用词以及计算tf-idf值-The Chinese text segmentation, excluding stop words and computing tf- idf values
learning
- 机器学习代码,贝叶斯java的实现代码。其他还用到了中文语言的分词器。有注释,易于阅读。-Machine learning code, Bayesian java implementation code. Other languages also uses the Chinese word breaker. Notes, easy to read.
fnlp-master
- 自然语言分析 1、分词 2、中文对比 3、很不错的分析工具-efaejkj lafjlkdjalkjkljr lkfajkdja d
云网论坛
- 云网论坛CWBBS2.5相比2.4RC版变化很大,文章发布、网站群部署、论坛界面DIV+CSS等都有了很大的提高。 2.5更新如下: CMS 1、目录管理改进为ajax方式,防止刷新,操作更方便,并且避免树形节点较多时打开慢的问题 2、增加fckeditor中的中文字体 3、修改fckeditor分页符 4、一个文章能同时发至多个栏目,取消原来的专题功能 5、增加用户组登录和发贴排行 6、改造文章发布编辑器中的上传文件及falsh,使之能够显示上传进度,并同时上传多个文件 7