[논문 리뷰] Attention is all you need

2025. 3. 31. 18:33· 인공지능/논문 리뷰

주기성	사인/코사인은 주기적인 함수라서, 상대 위치 간 패턴을 쉽게 잡을 수 있음
상대 거리 표현	어떤 위치 간의 차이가 일정하면 유사한 패턴을 가짐 (거리 유지)
학습 불필요	이 위치 인코딩은 고정 값이라 별도로 학습할 필요 없음 (학습 파라미터 아님)
멀티스케일 표현	높은 차원은 짧은 주기, 낮은 차원은 긴 주기를 가지므로 다양한 길이의 문맥 표현 가능

1. 기존 RNN / LSTM의 한계