Hamilton-Jacobi-Bellman Equation

System Dynamics

Problem: Noise σ: 0.30 Drift a: 0.50

Cost Function

State cost Q: 1.00 Control cost R: 1.00 Discount γ: 0.95

Hamilton-Jacobi-Bellman equation: For a controlled SDE dx = f(x,u)dt + σdW, the optimal value function V(x) satisfies: 0 = min_u [Q·x² + R·u² + f(x,u)·V' + ½σ²·V'' − γ⁻¹·V]. Minimizing over u (for quadratic control cost): u* = −f_u·V'/(2R), giving the feedback law. For LQR: V(x) = P·x², P satisfies the algebraic Riccati equation: 2aP − P²/R + Q + σ²P = 0. Value iteration: V_{n+1}(x) = min_u [Q·x²dt + R·u²dt + γ·V_n(x + f·dt + σ·√dt·ξ)].

Hamilton-Jacobi-Bellman Equation & Optimal Control

System Dynamics

Cost Function