상위 질문
타임라인
채팅
관점
비전 트랜스포머
시각 처리를 위한 기계 학습 알고리즘 위키백과, 무료 백과사전
Remove ads
비전 트랜스포머(Vision transformer)는 트랜스포머로 구축된 이미지 처리 모델이다. 2020년 "An image is worth 16x16 words" 논문에 의해 이미지를 단어처럼 처리하면 어떨까 하는 아이디어에서 시작되어, 분야에 따라 종래의 합성곱 신경망과 비슷한 성능을 내고 있다.

잘 알려진 프로젝트로는 Xception, ResNet,[1] DenseNet,[2] Inception[3] 등이 있다.
응용 분야
같이 보기
각주
외부 링크
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads