アテンション動作モード
同じ文章内で計算するSelf-Attention(自己アテンション)が生成AIの基礎です
2Dベクトル空間・リアルタイム幾何学マッピング
白い円盤をドラッグしてベクトルをリアルタイムに変形可能
① 入力ベクトル $X$ (埋め込み)
単語1 X₁=(1.3, 0.4)
単語2 X₂=(0.3, 1.5)
② 類似度の測定 ($Q$ と $K$)
Query Q₁ から Key K₁, K₂ への射影
内積スコア(影の長さ): S₁₁=0.0, S₁₂=0.0
内積スコア(影の長さ): S₁₁=0.0, S₁₂=0.0
⑤ Valueの加重合成 $Z$
アテンション比率: α₁V₁, α₂V₂
コンテキスト出力 Z₁=(0.0, 0.0)
コンテキスト出力 Z₁=(0.0, 0.0)
主役(Query)の切り替え:
スケーリング因子 ($\sqrt{d_k}$):
OFF
ON (√2)
Attention 計算ステップ
Step 1. 射影(Q, K, V の全並列算出)
Transformer(生成AI)の全入力トークン行列 $X = [X_1; X_2]$ に対し、学習パラメータである重み行列 $W_Q, W_K, W_V$ を並列に乗算します。 これにより、アテンション演算のベースとなる3組のペアベクトル(計6つ)を一度にすべて算出します。
Query (問い合わせ窓口)
・単語1の検索条件: Q₁
・単語2の検索条件: Q₂
Key (タグ・インデックス)
・単語1の索引特徴: K₁
・単語2の索引特徴: K₂
Value (中身・情報量)
・単語1が引き渡す内容: V₁
・単語2が引き渡す内容: V₂
自己アテンション(Self-Attention)では、QueryもKeyもValueも、すべて同一の入力文章情報から並列して生成されます。
Step 1 / 5