GPUの実行モデル（SIMT）

GPUが高い性能を発揮できる理由は、
単に「コア数が多い」からではありません。
GPUは、
SIMT（Single Instruction, Multiple Threads）
と呼ばれる実行モデルを採用しています。

SIMTとは何か

SIMTとは、
1つの命令を複数のスレッドで同時に実行する
方式です。

CPUのSIMDと似ていますが、
GPUでは
スレッドという単位
で管理される点が異なります。

GPU内部では、
複数のスレッドが
ワープ（Warp）
と呼ばれるグループにまとめられます。

そのため、
ワープ内で異なる分岐が発生すると、
直列実行
になり性能が低下します。

GPUは、
「全スレッドが同じ処理をする」
ことを前提に設計されています。

そのため、

といった処理では、
本来の並列性を活かせません。

CPUは、
分岐や例外処理を高速に行うため、
複雑な制御回路を備えています。

GPUは、
そのような制御を最小限に抑え、
演算器を大量に配置
する設計を選びました。

GPUは、
メモリアクセスなどで待ちが発生すると、
別のワープを即座に実行
します。

これは、
FPGAのように
「待ちを作らない」のではなく、
待ちを見えなくする
設計思想です。

SIMTモデルを理解することで、

が明確になります。
これは、
CPU・GPU・FPGA比較を理解するための
重要な前提知識
です。