Policy Gradient Methods

See: Markov Decision Process; Reinforcement Learning; Value Function Approximation.

References

(Peters & Bagnell, 2011) ⇒ Jan Peters; J. Andrew Bagnell. (2011). “Policy Gradient Methods.” In: (Sammut & Webb, 2011) p.774