资源列表
COAE2014task01
- 第六届中文倾向性分析评测(COAE2014)语料资料-Sixth corpus of Chinese tendentious analysis and uation (COAE2014) corpus
Spark高级数据分析
- 这个压缩包包括书和源代码,用于Spark学习和交流。(This compressed package includes books and source code for Spark learning and communication.)
麦肯锡:自动驾驶的瓶颈和进化过程
- 麦肯锡:自动驾驶的瓶颈和进化过程,PDF文档(McKinsey: the bottleneck and evolution of automatic driving)
ARMA-Java--master
- ARIMA模型是通过将预测对象随时间推移而形成的数据序列当成一个随机序列,进而用一定的数学模型来近似表述该序列。根据原序列是否平稳以及回归中所包含部分的不同分为AR、MA、ARMA以及ARIMA过程。 在模型的使用过程中需要根据时间序列的自相关函数、偏自相关函数等对序列的平稳性进行判别;而对于非平稳序列一般都需要通过差分处理将其转换成平稳序列(ARIMA);对得到的平稳序列进行建模以确定最佳模型(AR、MA、ARMA或者ARIMA)。在使用中最重要也是最关键的就是对序列进行参数估计,以检验其
ZWCDW
- 这是一个用visualprolog7 0编写的一个专家系统的实例()
降维code
- 了解降维、特征筛选等基本原理 掌握PCA、SVD、LAD和NMF等算法实现及应用(Understand the basic principles of dimensionality reduction and feature selection Master the algorithm implementation and application of PCA, SVD, lad and NMF)
nlp7294
- 22w条打好标签的数据,供短文本主题分类使用(22W labeled data for short text topic classification)
Python数据分析与挖掘实战
- 本书共15章,分两个部分:基础篇、实战篇。基础篇介绍了数据挖掘的基本原理,实战篇介绍了一个个真实案例,通过对案例深入浅出的剖析,使读者在不知不觉中通过案例实践获得数据挖掘项目经验,同时快速领悟看似难懂的数据挖掘理论。读者在阅读过程中,应充分利用随书配套的案例建模数据,借助相关的数据挖掘建模工具,通过上机实验,以快速理解相关知识与理论。(There are 15 chapters in this book, which are divided into two parts: the basic c
数据挖掘导论 完整版
- 讲解数据挖掘中用到的基本算法,描述了算法的数学原理,以及实际应用(Explain the basic algorithm used in data mining, describe the mathematical principle of the algorithm, and practical application)
PCA+mnist
- 基于python,利用主成分分析(PCA)和K近邻算法(KNN)在MNIST手写数据集上进行了分类。 经过PCA降维,最终的KNN在100维的特征空间实现了超过97%的分类精度。(Based on python, it uses principal component analysis (PCA) and K nearest neighbor algorithm (KNN) to classify on the MNIST handwritten data set. After PCA dime
python疫情数据可视化
- 通过时事数据可视化系统,可以清楚地了解全球疫情分布的状况以及密度,以便做出相应的对策(Through the current affairs data visualization system, it is possible to clearly understand the distribution and density of the global epidemic in order to make corresponding countermeasures)
SpringBoot+jsoup爬虫
- 本地创建.xlsx文件,里面存放京东商品地址,运行项目启动导入本地xlsx文件,自动爬取文件中地址信息下载到本地
