搜索资源列表
MyProject
- 文本分类,使用贝叶斯分类系统,训练集和测试集
wordmark
- 通过一个已经标号词性的训练集来得到训练数据,再根据训练数据对需要进行分词的数据进行分词,采用概率最高的分词情况为最后结果。-By a label the parts of speech training set training data to get the need segmentation data based on the training data segmentation with the highest probability of segmentation for the fin
CTB
- 中文分词和词性分析通用的训练集,含POS。-Chinese word segmentation and part of speech analysis of generic training set.
aclImdb_v1.tar
- 英文影评语料库,用于英文情感分析。包含训练集和测试集,均为标注数据。(English movie reviews corpus)