في التعلم المعزز (reinforcement learning)، الآلية التي من خلالها ينتقل الوكيل (agent) بين حالات (states) البيئة (environment). يختار الوكيل الإجراء باستخدام سياسة (policy).
0 125 أقل من دقيقة

في التعلم المعزز (reinforcement learning)، الآلية التي من خلالها ينتقل الوكيل (agent) بين حالات (states) البيئة (environment). يختار الوكيل الإجراء باستخدام سياسة (policy).