상위 질문
타임라인
채팅
관점
전이학습
기계 학습의 연구 문제 위키백과, 무료 백과사전
Remove ads
전이학습(Transfer learning, TL)은 하나의 문제를 해결하고 이와 다르면서 관련된 문제에 적용하는 동안 얻은 지식을 저장하는데 집중하는 기계 학습의 연구 문제이다.[1] 예를 들어 자동차를 인식하기 위해 학습하는 동안 얻은 지식은 트럭 인식을 시도할 때 적용할 수 있다. 이 연구 분야는 학습전이의 심리 문헌의 오랜 역사와 일정 부분 관련이 있지만 두 분야의 실질적인 연관성은 제한되어 있다. 이전에 학습한 새 태스크의 학습 작업으로부터 얻은 정보를 재사용 또는 전이시키는 것은 강화 학습 에이전트의 샘플 효율성을 상당히 개선시킬 가능성이 있다.[2]
전이 학습은 여러 목적 함수를 사용하여 훈련하기 때문에 비용 민감 기계 학습 및 다중 목적 최적화와 관련이 있다.[3]
역사
1976년에 보지노프스키(Bozinovski)와 풀고시(Fulgosi)는 신경망 훈련에서의 전이 학습을 다루는 논문을 발표했다.[4][5] 이 논문은 이 주제에 대한 수학적 및 기하학적 모델을 제시한다. 1981년 보고서에서는 전이 학습을 컴퓨터 터미널 문자를 나타내는 이미지 데이터셋에 적용하는 것을 고려하여 긍정적 및 부정적 전이 학습을 실험적으로 시연했다.[6]
1992년, 로리언 프랫은 식별 기반 전이(DBT) 알고리즘을 공식화했다.[7]
1998년까지 이 분야는 다중 작업 학습을 포함하도록 발전했으며,[8] 보다 공식적인 이론적 기초도 마련되었다.[9] 전이 학습에 대한 영향력 있는 출판물로는 1998년의 "Learning to Learn"이라는 책,[10] 2009년 설문 조사[11] 및 2019년 설문 조사가 있다.[12]
앤드루 응은 NIPS 2016 튜토리얼에서[13][14] 전이 학습(TL)이 지도 학습에 이어 기계 학습 상업적 성공의 다음 동력이 될 것이라고 말했다.
2020년 논문 "Rethinking Pre-Training and self-training"에서,[15] 조프(Zoph) 등은 사전 훈련이 정확도를 해칠 수 있으며 대신 자기 훈련을 옹호한다고 보고했다.
Remove ads
정의
전이 학습의 정의는 도메인과 작업 측면에서 주어진다. 도메인 는 특징 공간 와 주변 확률 분포 로 구성되며, 여기서 이다. 특정 도메인 이 주어졌을 때, 작업은 두 가지 구성 요소, 즉 레이블 공간 와 목적 예측 함수 로 구성된다. 함수 는 새로운 인스턴스 의 해당 레이블 를 예측하는 데 사용된다. 로 표시되는 이 작업은 쌍으로 구성된 훈련 데이터로부터 학습되며, 여기서 이고 이다.[16]
소스 도메인 와 학습 작업 , 대상 도메인 와 학습 작업 가 주어졌을 때, 또는 인 경우, 전이 학습은 와 의 지식을 사용하여 에서 대상 예측 함수 의 학습을 개선하는 것을 목표로 한다.[16]
Remove ads
응용
전이 학습을 위한 알고리즘은 마르코프 논리 네트워크[17] 및 베이즈 네트워크에서 사용할 수 있다.[18] 전이 학습은 암 아형 발견,[19] 건물 활용,[20][21] 일반 게임 플레이,[22] 텍스트 분류,[23][24] 숫자 인식,[25] 의료 영상 및 스팸 필터링에 적용되었다.[26]
2020년에는 물리적 특성이 유사하기 때문에 제스처 인식 도메인에서 정신 상태 인식 도메인으로, 근육에서 나오는 근전도 (EMG) 신호와 뇌전도 뇌파의 행동을 분류하는 것 사이에 전이 학습이 가능하다는 것이 발견되었다. 이러한 관계는 양방향으로 작용하여 뇌전도가 EMG를 분류하는 데에도 사용될 수 있음을 보여주었다.[27] 실험 결과 인공 신경망 및 합성곱 신경망의 정확도가[28] 전이 학습을 통해 어떤 학습 이전에 (표준 무작위 가중치 분포와 비교하여) 그리고 학습 과정이 끝날 때 (점근선) 모두 향상되었음이 주목되었다. 즉, 다른 도메인에 노출됨으로써 결과가 향상된다. 또한, 사전 훈련된 모델의 최종 사용자는 성능 향상을 위해 완전 연결 계층의 구조를 변경할 수 있다.[29]
같이 보기
각주
출처
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads