搜索资源列表
Colfax-HOW-Day-01
- 介绍了英特尔至强处理器和英特尔Xeon Phi协处理器和讨论它们的功能和目的。我们也开始介绍便携式的,面向未来的并行编程和讨论在英特尔MIC架构的高性能的先决条件:线程的并行性,矢量化和优化的内存访问模式。本课程将介绍本地的规划模型英特尔Xeon Phi协处理器,允许重用代码的应用程序设计为通用的CPU。会议的实践部分演示了如何在Linux操作系统(OS)在主机上运行的操作系统间的协处理器,以及如何使用英特尔的编译器上运行的处理器的本地应用程序。-Intel Architecture In
matmul.tar
- 矩阵乘法的多线程并行实现,包括:simple,采用openmp对索引顺序ijk(一般写法)的循环实现并行;opt,采用openmp对索引顺序ikj(向量化友好)的循环实现并行;mkl,调用高性能数学库实现矩阵乘法。(Multi-thread parallelization of matrix-matrix multiplication: "simple" case, ijk loop (usual pattern); "opt" case, ikj (ve
