الدورة عبارة عن تدريب عملي مكثف مصمم للمتخصصين الذين يرغبون في بناء أنظمة ذكاء اصطناعي باستخدام OpenAI Gym وتقنيات التعلم المعزز العميق. استنادًا إلى الكتاب الشامل وكلاء أذكياء عمليون مع OpenAI Gym، تقدم هذه الدورة رحلة عملية خطوة بخطوة عبر تطوير وكلاء أذكياء يحلون مهام العالم الحقيقي مثل لعب الألعاب، ومحاكاة الروبوتات، والقيادة الذاتية. تشمل الموضوعات الرئيسية: التعلم Q، التعلم Q العميق، إعادة تجربة الخبرة، طرق الفاعل-الناقد، وتخصيص البيئة. تغطي الدورة منصات أساسية مثل PyTorch و TensorBoard و CARLA و Roboschool و Gym-Retro و MuJoCo، وسيكتسب المشاركون المهارات اللازمة لتطبيق الوكلاء لمساحات العمل المنفصلة والمستمرة.
بحلول نهاية هذه الدورة، سيتمكن المشاركون من:
تستخدم هذه الدورة منهجية تطبيقية قائمة على المشاريع تجمع بين الأسس النظرية والممارسة الواقعية. سينخرط المتعلمون في دروس تفاعلية، تمارين بناء الوكلاء القائمة على المجموعات، عروض حية، ومشاريع تعلم معزز موجهة. يتم التركيز على التنفيذ العملي باستخدام PyTorch وملفات تهيئة JSON وتسريع CUDA و OpenAI Gym. ستوضح دراسات الحالة حول Mountain Car و Cart Pole وألعاب Atari ومحاكاة CARLA مبادئ التعلم الرئيسية. تضمن جلسات التغذية الراجعة والمناقشات الجماعية والمراجعات التأملية الاستيعاب والإتقان العملي.
يوصى بمعرفة عملية بلغة بايثون وفهم أساسي لمبادئ تعلم الآلة. الإلمام بـ NumPy والشبكات العصبية سيساعد ولكنه ليس إلزاميًا.
تُصمم جلسة كل يوم عادةً لتستمر حوالي 4-5 ساعات، مع تضمين فترات استراحة وأنشطة تفاعلية. تمتد مدة الدورة الإجمالية على مدار خمسة أيام، أي ما يقرب من 20-25 ساعة من التدريب.
تعمل شبكات الهدف على استقرار التعلم عن طريق الحفاظ على هدف Q ثابت أثناء التحديثات. تعمل إعادة تجربة الخبرة على تحسين كفاءة العينة وكسر الارتباطات الزمنية في بيانات التدريب، مما يساعد على تجنب التباعد في التعلم Q.
على عكس دورات الذكاء الاصطناعي العامة، يستند هذا البرنامج بشكل فريد إلى المنهجيات المثبتة والأمثلة الواقعية من كتاب وكلاء أذكياء عمليون مع OpenAI Gym. يركز على التطبيقات العملية على مستوى الكود لبيئات OpenAI Gym التعليمية مثل Mountain Car و Cart Pole، ويستخدم تقنيات تنفيذ وكلاء التعلم المعزز في PyTorch، ويضم TensorBoard لتصور تقدم التعلم المعزز. من خلال تغطية مجموعة متنوعة من الخوارزميات، بما في ذلك Rainbow RL و PPO و DDPG، فإنه يضمن مجموعة شاملة من المهارات.
ساعات معتمدة: 5 ساعة في اليوم
وضع الدورة: دوام كامل
مقدم الدورة: مركز (Agile Leaders) للتدريب
| الصورة | الموقع | التواريخ | المدة | النمط | السعر | الإجراءات |
|---|---|---|---|---|---|---|
|
|
عن بعد |
الأسبوع 32, 2026 03 - 07 اغسطس 2026 |
5 أيام | حضوري | €3,000 | |
|
|
أبوظبي |
الأسبوع 38, 2026 14 - 18 سبتمبر 2026 |
5 أيام | حضوري | €6,500 | |
|
|
أبوظبي |
الأسبوع 47, 2026 16 - 20 نوفمبر 2026 |
5 أيام | حضوري | €6,500 | |
|
|
دبي |
الأسبوع 02, 2027 12 - 16 يناير 2027 |
5 أيام | حضوري | €6,500 | |
|
|
دبي |
الأسبوع 13, 2027 30 مارس - 03 ابريل 2027 |
5 أيام | حضوري | €6,500 |