AMD、HPC向けGPU「Instinct MI100」FP32 / 64でNVIDIA A100を超える〜Zen3 3世代EPYCは2021年第1四半期に正式発表

1 min read

AMD Instinct MI100を搭載したアクセラレータカード

 AMD16日(現地時間)HPC向けアクセラレータ “AMD Instinct MI100」を発表した。AMD Instinct MI100はFP32(単精度浮動小数点)演算時の性能は、最大23.1TFLOPS、FP64(倍精度浮動小数点)演算時の性能は11.54TFLOPSであり、NVIDIAは、この春に提供を開始したNVIDIA A100を上回る性能を実現している。

FP64演算時の性能は11.54TFLOPS、FP32演算時の性能は23.1TFLOPSでNVIDIA A100を上回る

AMD Instinct MI100の性能

FP64演算時の性能は11.54TFLOPS、FP32演算時の性能は23.1TFLOPSされ、それぞれNVIDIAが、今年(2020年)を発表したNVIDIA A100のFP64時9.7TFLOPSとFP32時19.5TLOPSを上回っている。

しかし、NVIDIA A100発表時TF32(FP32とFP64のハイブリッド方式)と「Structural sparsity」という密度行列(Dense Matrix)疎行列(Sparse matrix)に置き換え演算する新しい方式の採用を明らかにしている。

したがってTF32は156TFLOPS、TF32 + Structural sparsityで312TFLOPSしているが、こちらは、ソフトウェア側の対応が必要となるため、現在のソフトウェアFP64とFP32演算をさせた場合には、AMDがNVIDIAを上回っていることをされている。

両社の発表を表にすると以下の通りである。

[표 2]AMD Instinct MI100とNVIDIA A100の性能比較
AMD Instinct MI100 NVIDIA A100
FP64 11.54TFLOPS 9.7TFLOPS
FP32 23.1TFLOPS 19.5TFLOPS
FP32マトリックス 46.1TFLOPS 312TFLOPS※1
FP16 / FP16マトリックス 186.4TFLOPS 624TFLOPS※2
Bflot16 92.3TLOPS 624TLOPS※2
INT8 184.6TOP 1,248TOPs※2
INT4 184.6TOP 2,496TOPs※2

※1 TF32 + Structural sparsity有効時
※2 Structural sparsity有効時

GPUの演算装置のみ利用FP64とFP32はAMD Instinct MI100を超える。 一方、Tensor Coreは、専用の演算器とStructural sparsityも使用することができINT4、INT8、TF32、Bfloat16演算時などには、NVIDIAのA100が高いピーク性能を発揮することができていると言えるだろう。

ROCm 4.0のリリース

既存のバージョンでは、ベータ版だった機能が正式版

AMDは、AMD Instinct MI100の発売によりNVIDIAが提供するCUDAに対応したソフトウェア開発キット「ROCm」の最新版となるROCm 4.0リリースも発表した。

ROCmでCUDAコードをロードAMD Instinctで使用できるコード変換ツールなどが用意されており、簡単にAMD Instinctためのソフトウェアを作成することができるようになる。 今回ROCm 3.0未完成だったHPC向けアプリケーションのサポートなどが行われ、より多くの用途にAMD Instinctを使用することができるようになるということだ。

Dell、HPE、GIGABYTE、SupermicroなどのOEMメーカーから提供される予定

AMD Instinct MI100は、今年末までに発売が予定されており、AMDのチャネルパートナーを通じてなどで販売される。 また、今後数カ月以内にDell、HP GIGABYTE、Supermicroなど、OEMのシステムに組み込まれて販売される計画である。

Zen3が第3世代のEPYCは今期中に発売

Zen3アーキテクチャ3世代EPYCは限られた顧客への第4四半期に出荷され、来年第1四半期に正式発表

AMDは、同社のデータセンター/ HPC向けのCPUとなるAMD EPYCに関する情報も更新された。

それによると、11月に出荷が開始された第4世代Ryzen(Ryzen 5000シリーズ)採択されたCPUアーキテクチャ「Zen3」を採用した次世代AMD EPYCがまもなくリリースされるという。

Zen3を採用したEPYCは「第3世代EPYC」という製品ブランドが第4四半期に選定されたHPCユーザーとクラウド事業者向けに出荷が開始されるという。公式発表は、来年(2021年)第1四半期が予定されている。

Intelも今年中に2ソケット用の次世代製品「Ice Lake-SP」の発表を計画しており、年末から来年にかけてのデータセンター/ HPC向けのプロセッサの競争がより激しくなるようだ。

Nakama Shizuka

"フリーランスの学生。微妙に魅力的な料理の達人。トータルベーコンの先駆者。旅行の第一人者。自慢のオーガナイザー。"

You May Also Like

More From Author

+ There are no comments

Add yours