image of header

Attention

2024/07/21

Basic concepts

  • input sequenceに対し、各inputベクトルへの適切な重み付き和を学習
  • Q, K, Vなる3つの行列を学習、inputからquery、key、valueを計算し上記の重みつき和を計算
  • self-attentionの場合、Q、K、Vに同一の行列を使用

Mathematical Expression

  • scaled dot-product attention

Examples

Copyright © 2024 All rights reserved.