搜索资源列表
Classifier4J
- Classifier4J这个Java类库为文本自动分类提供了一个API。缺省(目前)实现的API是一个贝叶斯分类器。这个类库可以用于多个目的-可能作为一个垃圾邮件过滤器或一个blog-Classifier4J Java class library for the automatic text classification provided an API. Default (current) to achieve the API is a Bayesian classifier. This lib
webcat
- 这是一个100 %纯Java库,您可以使用适用于N元 分析技术的过程分为文本文件。 该计划包括几个不同的分类算法, namelly 支持向量机,贝叶斯Logistic回归,神经网络分类和文本压缩 算法。如支持向量机和贝叶斯Logistic回归,一个 “一对一” 用于多类分类。更详细的说明这些学习算法和可用的选项,请提供的javadocs 。-It is a 100 pure Java library that you can use to apply N-Gr
pLSA
- 用于文本分析和分类的pLSA(Probability Latent Semantic Analysis)的Matlab算法,含有测试数据及算法原理介绍。也可用于图像分析。相比原来的版本,增加了示例程序demo.m,以实现可视化效果,用户更容易使用和理解pLSA算法。-For text analysis and classification of pLSA (Probability Latent Semantic Analysis) of the Matlab algorithm with tes
KNN0.0_0.0
- 这是用java实现的KNN算法分类器 实现了机器的自动学习与文本自动分类 仅供学习使用-This is a java implementation of the KNN algorithm with classifier achieved the automatic machine learning and text categorization learning to use only
baiyesi-for-note-classification
- 下载到的一个用java编写的贝叶斯简单文本分类的程序-Downloaded to a preparation using java simple Bayesian text classification program
NaiveBayesClassifier
- 基于朴素贝叶斯的文本分类代码实现,java-Based on Bayesian text classification code,java
knn
- 分别利用java和C++实现的KNN文本分类算法,每个程序模块都有详细注释-Respectively, the use of java and C++ implementation of KNN text classification algorithm, each program module has detailed notes
malletTest
- mallet测试代码, 非常优秀的自然语言处理工具包,基于Java编写,可以进行文本分类,聚类等功能,并且支持加入自定义的算法,其中有众多的API接口,有着很好的研究和实用价值。-mallet test code, very good natural language processing toolkit based on Java, you can text classification, clustering and other functions, and supports adding
Job1
- 这是一个实现文本分类的朴素贝叶斯方法,用java语言编写-This is a realization of Naive Bayesian text classification methods, written in java language
java_KNN
- 实现了KNN文本的分类,KNN最近邻基于欧几里德距离的JAVA算法实现适用于初级学习KNN的初学者。-Realization of KNN text classification, KNN nearest neighbor JAVA algorithm for Euclidean distance implementation is applied to the primary learning KNN beginners based on.
tfidf
- 用于文本分类,计算tfidf值,自己创建java工程,然后将类加进入就可以了。记得修改路径就行。-Clustering Algorithm
NGram
- java 实现基于N-gram的文本分类算法-java based N-gram-based text classification algorithm
Bias_algorithm_java
- 贝叶斯算法java实现,在贝叶斯算法思想基础上做改进,提供文本分类效率-Bias algorithm java implementation, based on the idea of Bias algorithm to improve the efficiency of text classification
MiniEditDistance
- java语言实现的文本分类的第一步,替换一个词语的最小代价,即为最小编辑距离-java implement the minimum edit distance
CNN
- 卷积神经网络的源代码,用于微博博文文本情感分析的三分类。(Convolutional neural network source code for micro-blog Bowen text sentiment analysis of the three categories.)
learning-spark-master
- 将逻辑回归应用于二元分类的情况。这里以垃圾邮件分类为例,即是否为垃圾邮件两种情况。然后,根据词频把每个文件中的文本转换为特征向量,训练出一个可以把两类消息分开的逻辑回归模型,判断输入测试语句是否为垃圾邮件。(Spark MLlib (Java): Input: spam.txt; normal.txt; text sentence. Output:1.0(spam), 0.0(normal email))