[Reinforcement Learning] Deep Q learning Intuition (2)

gwan9999 2023. 4. 23. 16:16

Actual action of Deep Q

그 어떻게 Q 값을 정할지에 대해서 neural network로 정한다고 하였고, 인공신경망의 가중치를 변경하는 과정은 기존에 계산된 Q state를 이용해서 loss function을 만든다고 하였고... 뭐 어떻게 학습할지에 대해서 다뤘다면, 실제 이 인공신경망을 이용해서 Agent의 행동을 어떻게 수행(?) 시킬까에 대해 알아보도록 하자

계산된 Q 값을 통해 우리는 softmax function에 넣을 것이다.

일단 softmax를 잘 모른다면 기본적으로 가장 그럴 듯한 경우를 알려주는 함수라고 생각하면 무리가 없을 것이다.