Xeon Phi

Xeon Phi

生産時期	2012年 11月から
生産者	インテル
プロセスルール	22nm から 14nm
アーキテクチャ	x86
命令セット	Intel 64
コア数	57から72 （スレッド数：228から288）
ソケット	LGA3647
コードネーム	Knights Corner Knights Landing Knights Mill
前世代プロセッサ	Larrabee
テンプレートを表示

第1世代

Knights Corner

第1世代 Xeon Phi。2012年 11月13日発表^[3]。製造プロセスは22nm Tri-Gateトランジスタを採用している（Ivy Bridgeと同一の製造プロセス）。インテルXeonプロセッサーE5ファミリーと組み合わせることで、カードあたり倍精度浮動小数点演算で1TFLOPS以上の理論性能がある。本製品はPCI Express形式の拡張カードで供給され、純粋に演算用であって、ラスタライザやビデオ再生エンジン、ディスプレイ出力は存在しない。

本製品の競合相手はNVIDIAのHPC向けGPUであるNVIDIA Tesla、およびAMDのHPC向けGPUであるAMD FirePro (FirePro Sシリーズ^[4]、旧称AMD FireStream) となる。Xeon Phiの強みはコアがx86であるために、x86 CPU向けに記述されたプログラムをほぼそのまま利用できる点である。またPCI Expressで接続されているが、本製品の内部にはスタンドアロン型のLinuxが常駐しており、SSHを使ってホストからログインすることができる。これは独立したOSを動作させられないGPGPUでは不可能である。勿論GPGPUと同様、オフロード計算をさせる動作も可能である。

SIMD命令は512ビットであり、倍精度浮動小数点数を8つ同時に扱うことができ、また FMA をサポートしているため、16 FLOPS/cycle である^[5]。なお同時期に発売されたHaswellのIntel AVX2は256ビットであり、同時に扱うことができる倍精度浮動小数点数は4つだが、FMAを2つ同時に計算できるため、同じく 16 FLOPS/cycle である^[6]。

PCI Express は Gen2.0 x16（片方向あたり8GB/s）。

2012年6月当時、44社のメーカーがロードマップへの組み込みを表明していた^[1]。

2017年1月にEnd of Lifeとなった。Intel Math Kernel Library のサポートも 2017 Update 4^[7]で終了した。

以下のプロセッサーオプションがある。
- -X: PCI Express接続
- -P: PCI Express接続、ヒートシンク付き
- -A: PCI Express接続、アクティブファン内蔵
- -D: SFF接続

さらに見る 型番, CPU ...

Knights Corner
型番	CPU	TDP (W)	内蔵メモリ
コア数（スレッド数）	クロック (GHz)	L2キャッシュ (MB)	規格	容量 (GB)
定格	ターボ
7120A	61 (244)	1.24	1.33	30.5	300	GDDR5	16
7120P
7120X
7120D	270
SE10P	1.1	N/A	300	8
SE10X
5120D	60 (240)	1.05	30	245
5110P	225
31S1P	57 (228)	1.1	28.5	270
3120A	300	6
3120P

Xeon Phi 5110P: 2012年 11月13日発表、2013年 1月28日発売。Tri-Gateトランジスタを採用し22nmで製造された製品である。60コア、動作クロックは1.053GHz。倍精度浮動小数点演算の理論性能値は1.011TFLOPS。搭載されるメモリーはGDDR5の8GBで帯域幅は320GB/sである。TDPは225W。5110Pが導入されるシステムにおいてはラック単位での冷却がなされることが想定されているため、カード本体には冷却用の回転ファン機構は存在していない。ホストバスはPCIe2.0であるが、転送レートが高速化されているのでPCIe3.0による接続と性能にあまり変わりはない。コアあたりのL2キャッシュは512KBで、チップ全体でのL2キャッシュの総量は30MBである。メモリーインターフェイスは32bit幅で動作しており、合計で512bit幅である。補助電源コネクタは8ピン+6ピン構成。
Xeon Phi 5120D, 3120P, 3120A, 7120P, 7120X: 2013年 6月18日発売開始。
Xeon Phi 31S1P: 2013年第2四半期に発売。中国のスーパーコンピュータシステム「天河2」に用いられた。

第2世代

Knights Landing

第2世代 Xeon Phi。2016年 6月20日発表^[8]^[9]^[10]。単精度で 6 TFLOPS 以上、倍精度で 3 TFLOPS 以上になった。プロセスルールは14nm。Atom の Silvermont ベースになった^[11]。

型番の末尾にFがつくものはインターコネクトの Intel Omni-Path Fabric を搭載。

ソケットは LGA3647 だが、通常の Xeon との互換性はなく、Xeon Phi 専用のマザーボードでなければ動作しない（物理的にソケットにはまらない）。

オンチップメモリは L3 キャッシュとしても利用できるし、アドレスを割り振り通常のメモリとしても利用可能。7.2 GT/s のもので実測で 490 GB/s になる^[12]。

1コアあたり、4スレッド実行可能で、2つのベクターALU（512ビット）、2つのスカラーALU、1つのレガシーx87 ALUを搭載している^[9]。よって72コア、1.5 GHzで、単精度は 512 bit / 32 bit * 2 ALU * 2 op * 72 core * 1.5 GHz = 6912 GFLOPS になる。

Knights Landing で採用される512ビット SIMD命令はAVX-512として定義されたものになるが、これはそれまでのKnights Cornerが用いていた「512ビットSIMD演算」とは機械語命令形式が異なり互換では無い^[13]。

PCI Express は Gen3.0 x16 (片方向あたり16GB/s)。

対応ソケット: LGA3647

さらに見る 型番, CPU ...

Knights Landing
型番	CPU	TDP (W)	内蔵メモリ	対応メモリ
コア数（スレッド数）	クロック (GHz)	L2キャッシュ (MB)	規格	容量 (GB)
定格	ターボ
7290F	72 (288)	1.5	1.7	36	260	MCDRAM	16	DDR4-2400
7290	245
7250F	68 (272)	1.4	1.6	34	230
7250	215
7230F	64 (256)	1.3	1.5	32	230
7230	215
7210F	230	DDR4-2133
7210	215

Knights Mill

2017年 12月18日^[14]^[15]発表^[16]。Knights Landing をディープラーニング向けに改良。Intel AVX-512のサポートを拡張し、AVX512_4FMAPS、AVX512_4VNNI、AVX512_VPOPCNTDQをサポートした^[16]。FP32やINT16の演算を高速化している^[17]。x200 よりも FP32 の行列積での演算が2倍^[18]高速になった。

なお、Knights Millの後継としてKnights Hillが予定されていた^[11]^[19]^[20]が、キャンセルされた^[21]。

対応ソケット: LGA3647

さらに見る 型番, CPU ...

概要

世代

第1世代

第2世代

脚注

参考資料

関連項目

外部リンク

Wikiwand - on