搜索资源列表
class
- 中文文本分类可以对已经分好词的文本进行分类,先自己导入数据,用libsvm中的svm进行分类和预测,特征用tfidf算法,还利用卡方检验进行了特征选择,可自行设定阈值-text mining
DeleteStopWord
- 此源码组要用于中文文本预处理。源码首先进行文本分词,分词之后对文本中的停用词进行过滤。-text preprocessing
ictclas2013_release
- ICTCLAS2013 java版,中文文本分词系统-ICTCLAS2013 java
SegDemo
- stanford分词器的使用示例,本分词器适用与中文-Example of use stanford word segment
ReadFiles
- 对中文文本进行分词,去停用词以及计算tf-idf值-The Chinese text segmentation, excluding stop words and computing tf- idf values
learning
- 机器学习代码,贝叶斯java的实现代码。其他还用到了中文语言的分词器。有注释,易于阅读。-Machine learning code, Bayesian java implementation code. Other languages also uses the Chinese word breaker. Notes, easy to read.
fnlp-master
- 自然语言分析 1、分词 2、中文对比 3、很不错的分析工具-efaejkj lafjlkdjalkjkljr lkfajkdja d
云网论坛
- 云网论坛CWBBS2.5相比2.4RC版变化很大,文章发布、网站群部署、论坛界面DIV+CSS等都有了很大的提高。 2.5更新如下: CMS 1、目录管理改进为ajax方式,防止刷新,操作更方便,并且避免树形节点较多时打开慢的问题 2、增加fckeditor中的中文字体 3、修改fckeditor分页符 4、一个文章能同时发至多个栏目,取消原来的专题功能 5、增加用户组登录和发贴排行 6、改造文章发布编辑器中的上传文件及falsh,使之能够显示上传进度,并同时上传多个文件 7