|
计算能力设备的计算能力由版本号表示,有时也称为“SM 版本”。此版本号标识 GPU 硬件支持的功能,并在运行时由应用程序使用来确定当前 GPU 上可用的硬件功能和/或指令。计算能力由主修订号X和次修订号Y组成,用XY表示。具有相同主修订号的设备属于相同的核心架构。基于NVIDIA Hopper GPU架构的设备主修订号为 9,基于NVIDIA Ampere GPU架构的设备主修订号为 8,基...
2024-08-12
SCALAPACK编译 SCALAPACK(Scalable SAPACK)是一个并行计算软件包,适用于分布式并行计算机。它是为异构计算而设计的,支持任何MPI,具有高效、可移植、可伸缩、高可靠等优点,利用它的求解库可以开发出基于线性代数运算的并行应用程序。源码可以从http://netlib.org/scalapack下载。 下载源码包:wget http://www.netl...
2022-12-30
Intel-MKL Intel数学核心函数库(MKL)是一套高度优化、线程安全的数学例程、函数,面向高性能的工程、科学核财务应用。英特尔MKL的集群版本包括ScaLAPACK与分布式内存快速傅里叶转换,并提供了线性代数(BLAS、LAPACK和Sparse Solver)、快速傅里叶转换、矢量数学与随机号码生成器等功能。 MKL的主要功能如下: BLAS和LAPACK S...
2022-12-29
BLAS(BasicLinearAlgebraSubprograms,基础线性代数程序集)是一个应用程序接口(API)标准,用以规范发布基础线性代数操作的数值库(如矢量或矩阵乘法)。Netlib用Fortran实现了BLAS的这些API接口,得到的库也叫做BLAS。
2022-12-28
NVIDIA RTX 6000 Ada即将在2022年12月份上市,它是功能最强大的工作站 GPU,可提供高性能、实时光线追踪、AI 加速计算和专业图形渲染。与上一代产品相比,基于 NVIDIA Ada Lovelace 架构的 CUDA 核心提供超过 2 倍的单精度浮点 (FP32) 吞吐量,为绘图工作程序(例如 3D 模型开发)和计算工作负载(例如桌面仿真)提供显着性能改进计算器辅助工程...
2022-12-12
HPC 应用程序跨越从流体动力学到天气模拟的许多领域。CUDA-X HPC 是一个库、工具、编译器和 API 的集合,可帮助开发人员解决世界上最具挑战性的问题。
2022-11-25
|