kabupen.com
Home
Blog
Devs
About
GitHub
「Sarsa」タグの記事一覧
2025/11/30
Sarsa による行動価値関数の学習 ー ベルマン方程式から TD 誤差まで
行動価値関数のベルマン方程式を期待値の形で捉え直し、TD誤差の導入から Sarsa による on-policy な価値学習までを丁寧に解説します。
強化学習
# Sarsa
# TD学習
# 価値ベース
# ベルマン方程式