搜索资源列表
ems
- 建模优化与评价的理论基础学习,用于统计分析和数据挖掘-Based learning theory and modeling optimization and uation for statistical analysis and data mining
three_gram_train
- 直接从文本文档中统计建立三阶语言模型的MATLAB程序-Text document directly MATLAB programs set up third-order statistical language model
lda_perplexity
- 用训练出的模型测试词以及概率,并统计词数和计算困惑度-With the trained model test and the probability and statistics of words, words and perplexity calculation
data_mining
- 这是一个R的程序 文本挖掘的作业,用来统计新闻类别再进行分类 -This is an R program text mining operations for Statistical News category then classified
pls
- 多元统计回归,偏最小二乘,适用于数据挖掘-Multivariate Statistics
R-for-Beginners
- R语言是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具,提供相关学习资料-R Language is a free GNU system belong, free, open source software, it is an excellent tool for statistical computing and statistical mapping to provide relevant learning materials
Hadoop
- 使用hadoop开发,可以对输入文件中出现的关键词统计词频并进行不同文本词频统计高低的排序,本代码需要用户自行定义关键词和输入文件-Use hadoop development, can appear in the input file keyword statistics word frequency and low frequency statistics different sort of text, the code requires a user-defined keywords an
Data
- 《R统计与数据挖掘》一书中所有源码,可以直接编译- R statistics and data mining, a book all the source code, can be directly compiled
delete-outliers
- 用于去除一个数据集中的野点的matlab函数,可应用数据建模及统计分析-For input vector A, returns a vector B with outliers (at the significance level alpha) removed. Also, optional output argument idx returns the indices in A of outlier values. Optional output argument outlie
programme
- 将彩色图转化成灰度图,在此基础上统计连通区域,根据一定的统计特性,设置一定的准则,检测出人脸。-The color map is converted to grayscale, communicating regional statistics on this basis, according to certain statistical properties, set certain criteria, detects a person' s face.
R-programming-language
- R语言统计软件介绍,较基础,适合初学者学习。-R programming
DataTest
- 统计一亿个IP中每个出现的次数,找不到大数据之类的分类,只能选择数据挖掘-Statistics IP in one hundred million times each appears, can not find such a large data classification, data mining can only choose
bayes
- 基于自然对数改进的朴素贝叶斯,统计TPR,NPR,TFR,TPR-Based on the natural logarithm improved Naive Bayes
k_nn
- kNN的思想:计算待分类的数据点与训练集所有样本点,取距离最近的k个样本;统计这k个样本的类别数量;根据多数表决方案,取数量最多的那一类作为待测样本的类别。距离度量可采用Euclidean distance,Manhattan distance和cosine。-kNN The idea is simple: the training set and calculated data points to be classified all sample points taken the neare
code
- (神经网络)多个隐含层的多层感知器网络训练数据得到网络,并使用测试数据统计所设计多层感知器的平均识别正确率-Multi layer perceptron network training data with multiple hidden layers is obtained, and the average recognition accuracy of the multi-layer perceptron is designed by using the test data statisti
Part1
- 实现了500篇纽约时报新闻的数据挖掘,包括数据预处理、基本数据统计等-Achieved 500 New York Times news data mining, including data preprocessing, basic data statistics, etc.
code_BPMF
- 如何使它工作: 1。创建一个单独的目录,并将所有这些文件下载到相同的目录中 2。下载7个文件: *demo:主文件demo:PMF和贝叶斯PMF * PMF.m:训练的PMF模型 * bayespmf.m贝叶斯PMF模型实现吉布斯采样器。 * moviedata.mat样本数据包含三元组(user_id,movie_id,评分) * makematrix.m:辅助功能转换成大型矩阵的三元组。 * PRED.m:辅助功能使得预测验证集。 三.在Matlab只需运
统计建模于R
- 基于R语言的建模,结合例子的代码实现,包括假设检验与各种统计量的计算(Based on the R language modeling, combined with the code implementation of the example, including the hypothesis test and the calculation of various statistics)
Multivariate analysis
- 里面包括了一些常见的多元统计分析程序,适合简单快捷的数据探索和挖掘分析(It includes some common multivariate statistical analysis programs, suitable for simple and fast data exploration and mining analysis.)
统计分析与SPSS的应用-薛薇
- 《统计分析与spss的应用第五版》深入浅出地讲解统计方法,基于应用案例阐述数据分析的一般思路和SPSS操作实践,使读者知其然更知其所以然,是本书一直坚持的风格。本书的特色在于:注重方法核心原理的讲解,突出以统计原理明晰为前提的SPSS实操。基于典型统计分析案例,循序渐进地引导读者利用SPSS实现数据的组织、整理、描述和建模分析。旨在帮助读者领会统计分析方法精髓,掌握SPSS软件操作,拥有利用SPSS解决实际数据分析问题的能力。(Statistical analysis and the appli
