Attention Mechanism Deep Visualizer

全計算ペアのデータフローを一切省略せずに網羅した完全シミュレータ

アテンション動作モード

同じ文章内で計算するSelf-Attention(自己アテンション)が生成AIの基礎です

2Dベクトル空間・リアルタイム幾何学マッピング

白い円盤をドラッグしてベクトルをリアルタイムに変形可能
① 入力ベクトル $X$ (埋め込み)
単語1 X₁=(1.3, 0.4) 単語2 X₂=(0.3, 1.5)
② 類似度の測定 ($Q$ と $K$)
Query Q₁ から Key K₁, K₂ への射影
内積スコア(影の長さ): S₁₁=0.0, S₁₂=0.0
⑤ Valueの加重合成 $Z$
アテンション比率: α₁V₁, α₂V₂
コンテキスト出力 Z₁=(0.0, 0.0)
主役(Query)の切り替え:
スケーリング因子 ($\sqrt{d_k}$):
OFF ON (√2)

Attention 計算ステップ

Step 1. 射影(Q, K, V の全並列算出)

Transformer(生成AI)の全入力トークン行列 $X = [X_1; X_2]$ に対し、学習パラメータである重み行列 $W_Q, W_K, W_V$ を並列に乗算します。 これにより、アテンション演算のベースとなる3組のペアベクトル(計6つ)を一度にすべて算出します。

Query (問い合わせ窓口)

・単語1の検索条件: Q₁
・単語2の検索条件: Q₂

Key (タグ・インデックス)

・単語1の索引特徴: K₁
・単語2の索引特徴: K₂

Value (中身・情報量)

・単語1が引き渡す内容: V₁
・単語2が引き渡す内容: V₂

自己アテンション(Self-Attention)では、QueryもKeyもValueも、すべて同一の入力文章情報から並列して生成されます。

Step 1 / 5