2026/02/11
TransformerのEncoder/DecoderとSelf・Masked・Cross Attentionを、行列の形と直感(Q/K/V)で改めて整理してみました。式と図を一対一で対応させて理解するためのメモとして。