Reinforcement learning 기초

[Reinforcement Learning] Plan에 대해

gwan9999 2023. 4. 11. 21:43

What is the Plan ?

여기 Bellman equation을 통해 $ \gamma = 0.9 $ 로 놓고 각 state를 분석한 미로가 있다.

이 미로에 대한 정보는 Bellman Equation 편을 참고하길 바란다.

 

그렇다면 "Plan"이란 것은 무엇일까 ?

Plan이란 해당 state의 value를 바탕으로 "이 state에 도착하면 어떻게 할 것인가 ! "

에 대한 계획을 짜는 것이다. 

 

따라서 각 state의 value 대신 어떻게 가야할지 간단히 화살표로 나타내어보자.


가장 좋은 시나리오는

Agent가 가능한 모든 state에 대해 value를 평가하여 다음과 같은 Plan를 짤 수 있는 것이 중요하다.

 

당연하지만, 다음과 같은 예시 plan에서는 어느 state에서 시작해도 결국 Goal까지 가는 것을 알 수 있다.