计算能力设备的计算能力由版本号表示,有时也称为“SM 版本”。此版本号标识 GPU 硬件支持的功能,并在运行时由应用程序使用来确定当前 GPU 上可用的硬件功能和/或指令。计算能力由主修订号X和次修订号Y组成,用XY表示。具有相同主修订号的设备属于相同的核心架构。基于NVIDIA Hopper GPU架构的设备主修订号为 9,基于NVIDIA Ampere GPU架构的设备主修订号为 8,基...
2024-08-12

SCALAPACK编译


SCALAPACK(Scalable SAPACK)是一个并行计算软件包,适用于分布式并行计算机。它是为异构计算而设计的,支持任何MPI,具有高效、可移植、可伸缩、高可靠等优点,利用它的求解库可以开发出基于线性代数运算的并行应用程序。源码可以从http://netlib.org/scalapack下载。



下载源码包:wget http://www.netl...
2022-12-30

Intel-MKL


Intel数学核心函数库(MKL)是一套高度优化、线程安全的数学例程、函数,面向高性能的工程、科学核财务应用。英特尔MKL的集群版本包括ScaLAPACK与分布式内存快速傅里叶转换,并提供了线性代数(BLAS、LAPACK和Sparse Solver)、快速傅里叶转换、矢量数学与随机号码生成器等功能。



MKL的主要功能如下:


BLAS和LAPACK


S...
2022-12-29
FFTW编译安装FFTW是一个快速计算离散傅里叶变换的标准C语言程序集,它包含对共享和分布式存储系统的并行变换,它可自动适应你的机器、缓存、存储器大小、寄存器个数。通常比目前其他开源Fourier变换程序都要快。编译前的准备工作需要并行计算,设置为可以使用MPI,首先在环境变量中指定MPIvi .bashrc添加以下语句:#OPENMPI3.1export PATH=/data/openmp...
2022-12-28
BLAS(BasicLinearAlgebraSubprograms,基础线性代数程序集)是一个应用程序接口(API)标准,用以规范发布基础线性代数操作的数值库(如矢量或矩阵乘法)。Netlib用Fortran实现了BLAS的这些API接口,得到的库也叫做BLAS。
2022-12-28

BLACS


BLACS(Basic Linear Algebra Communication Subprograms)是基本线性代数通信子程序,目的是创建一个面向线性代数的消息传递接口,该接口可以在多种分布式存储平台上高效、统一地实现。源码可以从http:www.netlib.org/blacs下载



下载源码包:wget http://www.netlib.org/blacs/m...
2022-12-27
NVIDIA RTX 6000 Ada即将在2022年12月份上市,它是功能最强大的工作站 GPU,可提供高性能、实时光线追踪、AI 加速计算和专业图形渲染。与上一代产品相比,基于 NVIDIA Ada Lovelace 架构的 CUDA 核心提供超过 2 倍的单精度浮点 (FP32) 吞吐量,为绘图工作程序(例如 3D 模型开发)和计算工作负载(例如桌面仿真)提供显着性能改进计算器辅助工程...
2022-12-12
HPC 应用程序跨越从流体动力学到天气模拟的许多领域。CUDA-X HPC 是一个库、工具、编译器和 API 的集合,可帮助开发人员解决世界上最具挑战性的问题。
2022-11-25
客服咨询
0752-7897707
邮政编码:516870
客服邮箱:156449799@qq.com
公司地址:广东省惠州市永汉文建路59号
宝禄微信公众号
宝禄微信小程序
在线客服
 
 
 工作时间
周一至周五 :8:00-18:00
周六至周日 :10:00-17:00
 联系方式
客服热线:0752-7897707
赵工邮箱:156449799@qq.com