[강화학습]

[강화학습] 1. 강화학습이란?

딥러닝 도전기 2021. 8. 14. 02:15
"강화"라는 개념은 행동심리학에서 등장한 개념으로 동물이 시행착오를 통해 학습하는 방법이다.

강화란?

 

스키너라는 행동심리학자는 강화라는 개념을 제시합니다.

 

시행착오 학습에서 강화라는 것은 동물이 이전에 배우지 않았지만, 직접 시도하며 행동과 그 결과로 나타나는 좋은 보상 사이의 상관관계를 학습하는 것을 의미합니다.

 

예시로 시행착오 학습 실험인 스키너의 쥐 실험에 대해 알아보겠습니다.

 

  • 굶긴 쥐를 상자에 넣고 이 상자 안에 페달을 누르면 먹이가 나오는 장치를 설치합니다.
  • 쥐는 우연히 페달을 밟고 먹이를 먹게 됩니다.
  • 처음에는 먹이와 페달 사이의 상관관계를 모릅니다.
  • 우연히 페달을 더 누르고 먹이와 페달의 상관관계에 대해 학습하게 됩니다.

이러한 과정을 "강화"라고 합니다.

이러한 강화의 개념이 강화 학습의 모티브가 됩니다.

 

 

강화 학습이란?

 

강화 학습을 이야기하기 전에 머신러닝에 대한 이야기를 하겠습니다.

머신러닝은 "기계가 스스로 학습하는 알고리즘을 개발하는 연구 분야"라고 합니다.

이 머신러닝은 지도 학습, 비지도 학습, 강화 학습으로 나뉩니다.

각 분야를 간단하게 살펴보면

 

  • 지도 학습 : "정답"을 알고 있는 데이터를 이용해 기계를 학습
  • 비지도 학습 : 정답이 없이 주어진 데이터로만 기계를 학습
  • 강화 학습 : "행동"에 대한 "보상"을 통해 기계를 학습

입니다.

 

"행동에 대한 보상을 통해 학습"이라고 되어있는 것은 위에서 정의한 "강화"처럼 보상을 얻게 하는 행동을 점점 더 많이 하도록 학습하는 것을 의미합니다.

 

강화 학습에 대해 정리하자면,

"강화 학습은 컴퓨터가 선택한 행동에 대한 보상을 받고, 시행착오를 겪으며 보상을 최대로 받도록 학습(강화)하는 것"입니다.

반응형