搜索资源列表
Clustering.zip
- 数据挖掘算法的实现,基于模糊聚类的最大树算法,数据集是darpa99,也就是KDD-CUP99中采用的数据集,The realization of data mining algorithms, based on fuzzy clustering of the largest tree algorithm, a data set is darpa99, which is used in KDD-CUP99 data set
ibm
- 生成测试集,要做数据挖掘的关联规则试验,少不了数据集,人工生成的数据集可以采用agrawal等人实现的一个数据集生成器,叫:IBM Quest Market-Basket Synthetic Data Generator-生成测试集
CAIM
- 粗糙集理论中连续属性离散化操作算法,matlab上运行,有数据集-Rough Set Theory discretization operation algorithm
DM4
- 执行流程: 1. 用户输入参数:K的选择,训练数据,测试数据的路径; 2. 读取训练数据集和测试数据集文件,用ArffFileReader类读取并组织起InstanceSet数据结构; 3. 利用上面的相似度量标准,对每一个测试集中的Instance,计算与其最相似的K个训练集中的Instance,通过投票进行分类,将分类结果存储经Instance的成员变量targetGuess中; 4. 对分类结果进行度量,包括分类正确率,各种类别实例的Precision,Recall;Con
《数据结构(C语言版)习题集》答案
- 清华1992年版的数据结构的答案-Tsinghua University in 1992 version of the data structure of the answer
IBM_data_gen
- IBM实验室提供的数据集生成器源码,可以数据挖掘中经常使用的关联规则数据集。-IBM laboratory data sets provided by the generator source, Data mining can be used in the association rules data sets
JTS
- JTS拓扑结构程序组是一个通过使用明确的精度模型和健壮的几何算法来执行空间数据操作的Java应用编程孔。JTS是用来对可以支持空间数据集的确认、处理、综合及质疑的应用程序进行改善。这篇文献就是对在JTS拓扑程序组中执行的类、方法与算法进行说明-JTS Topology program group is defined through the use of a precision model and robust geometric algorithm to implement the spati
shujucangku
- 基于一家销售公司的数据仓库,建立4个多维数据集,包括钻取,切片等操作-Based on a sale of the company' s data warehouse, the establishment of four multi-dimensional data sets, including coring, slicing and other operations
cloudPlot
- 一种用于生成二维数据分布图形的函数,在观察大数据量的数据集合是很有效.-A function to plot the distribution of 2-dimensional data
comparison
- 本文有对大数据集的数据挖掘技术比较结果,帮助大家选择合适的方法-This article has pairs of large data sets compare the results of data mining technology to help you choose the right method of
dbscan
- DBSCAN算法,利用数据集中密度差异来区分不同聚类。-DBSCAN algorithm, the density difference between the use of data sets to distinguish between different cluster.
os-weka1-Examples
- 在weka环境下进行数据挖掘数据,一个数据集实例-Environment in the weka data mining data, a set of instance data
海量数据计算平台的开发软件平台简介
- Hadoop是一个开发和运行处理大规模数据的软件平台,是Appach的一个用java语言实现开源软件框架,实现在大量计算机组成的集群中对海量数据进行分布式计算.
粗糙集全部算法
- 实现了粗糙集的全部算法,从属性约简到决策规则的产生,并且内附测试数据,可以和数据库直接链接。
EhCache 分布式缓存集群方案
- EhCache 是一个纯 Java 的进程内缓存框架,具有快速、精干等特点,是 Hibernate 中默认的 CacheProvider。由于 EhCache 是进程中的缓存系统,一旦将应用部署在集群环境中,每一个节点维护各自的缓存数据,当某个节点对缓存数据进行更新,这些更新的数据无法在其它节点中共享,这不仅会降低节点运行的效率,而且会导致数据不同步的情况发生。例如某个网站采用 A、B 两个节点作为集群部署,当 A 节点的缓存更新后,而 B 节点缓存尚未更新就可能出现用户在浏览页面的时候,一会是
数据挖掘
- 对于初学者学习weka这个数据处理的软件有用,arrf数据集(For beginners to learn Weka, this data processing software useful, arrf data set)
Data set for data mining
- 该文档为自用数据挖掘数据集,数据量相对较小,用于数据挖掘初学者使用(thank you for download)
apriori
- 数据挖掘Aprior的简易c++实现,通过string来表示数据集,没有采用STL set集合操作,因此实现起来简单一些,判断是否包含用到了动态规划算法中的最长公共子序列,思想是暴力求解,没有用到很高端的思想和算法。(Simple c++ data mining Aprior, said data set by the string, without the use of STL set collection operation, thus the realization is simple,
主成分分析PCA
- 用PCA算法对iris数据集进行主成分分析(The PCA algorithm is used to analyze the iris data set)
热带气旋最佳路径数据集
- 本文件是中国气象局上海台风研究所发布的历史台风数据,包括最佳路径、台风中心气压和移速等数据,对研究台风及其引起的台风风暴潮有指导性意义,也是国内为数不多的完整记载台风数据的资料。