资源列表
k-means1
- Python version of k-means for data clustering
LRMR
- Linear Regression with MapReduce
1
- GN算法是一种分裂型的社区结构发现算法。该算法根据网络中社区内部高内聚、社区之间低内聚的特点,逐步去除社区之间的边,取得相对内聚的社区结构。(GN algorithm is a divisive community structure discovery algorithm. According to the characteristics of high cohesion within the community and low cohesion between communities, th
SMOTE
- 针对非平衡数据集中少数类数据过少的问题进行过采样,SMOTE算法采用人工合成稀有类的方法将非平衡数据变为平衡数据之后在用于数据挖掘(Over sampling techniques for minority data)
MATLAB_SMOTE
- SMOTE插值算法,补全数据的不平衡性。(SMOTE interpolation algorithm to complete the imbalance of data.)
MF-DFA-master
- 多重分形去趋势波动分析法,用于不同时间序列的重分形交叉相关性分析。(Multifractal detrended fluctuation analysis)
小波包能量谱
- 用于信号特征提取,提取信号的小波包能量谱(Extracting the wavelet packet energy spectrum of the signal)
my_apriori
- 很好用的关联规则挖掘经典算法,推荐使用。包括支持度、置信度、提升度,输出结果到excel文件(Good use of association rules mining classic algorithm, recommended)
R语言画地图
- 使用R语言画中国行政地图,并添加数据、美化。(Draw Chinese administrative map with R language, add data and beautify.)
ml_homework_1
- 此代码使用python中的sklearn实现了对uci中spambase垃圾邮件数据集的分类(This code uses sklearn in Python to realize the classification of spam dataset in UCI)
BIC确定GMM聚类簇数
- 通过贝叶斯信息准则确定高斯混合聚类方法的聚类簇数(Determining the Cluster Number of GMM Clusters by BIC)
sougou
- 网络爬虫,输入关键词和页数,自动下载搜狗图库图片(Input keywords and pages, automatically download the picture of Sogou library)
