essay0263 님의 블로그

  • 홈
  • 태그
  • 방명록

AI 공부 1

트랜스포머 논문 리뷰

트랜스포머 개괄트랜스포머는 원래 기계 번역을 위해 개발된 모델이다. 개괄적으로 보면 인코더-디코더 구조이고, input- encoder -decoder -output 순서로 진행된다. 인코딩 부분은 여러 개의 인코더를 쌓아 올려 만든 것이고, 논문에서는 6개를 쌓았다. 디코더도 인코더와 동일한 수를 가진다. 인코더들은 모두 똑같은 구조를 가지고 있는데, 서로 weight를 공유하진 않는다. 인코더는 self attention과 feed forward neural network로 구성되어 있다. 인코더로 들어온 입력은 self attention layer을 지나가면서 입력 내의 다른 단어들과의 관계도를 계산한다. 즉, 인코더를 지나가면 단어들이 문맥을 반영하게 된다. 디코더는 동일한 구조지만 self at..

AI 공부 2025.01.31
이전
1
다음
더보기
프로필사진

essay0263 님의 블로그

essay0263 님의 블로그 입니다.

  • 분류 전체보기 (24)
    • upstage ai lab (6)
    • 코딩테스트 (16)
    • 프로젝트 (1)
    • AI 공부 (1)

Tag

패스트캠퍼스AI부트캠프, 패스트캠퍼스업스테이지에이아이랩, HackerRank, 업스테이지패스트캠퍼스, 패스트캠퍼스업스테이지부트캠프, 패스트캠퍼스, UpstageAILab, 국비지원,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/05   »
일 월 화 수 목 금 토
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바