בפרק זה נדבר על למידה חיזוקית - Reinforcement Learning.
נדבר על מושגי היסוד בתחום (environment, state, policy, agent, reward), על סיווג של התחום הזה ב-Machine Learning, על למה זה נהיה מאוד פופולארי, על הקשיים בתחום ועל דילמת ה-Exploration - Exploitation.
קישורים שהוזכרו:
שיתוף פעולה בין סוכנים במשחק המחבואים
שיתוף פעולה בין סוכנים במשחק תפוס את הדגל
סדרת הרצאות של David Silver
Agent57 - מודל אחד שמשחק ברמה אנושית ב 57 משחקים
BRETT- הרובוט שמרכיב לגו
MuJoCo מנוע המדמה את חוקי הפיסיקה