هزینه آموزش
۷۸,۰۰۰ تومان

آموزش یادگیری تقویتی ویژه مهندسی کنترل

آموزش یادگیری تقویتی ویژه مهندسی کنترل

تعداد دانشجو
۱۲۸ نفر
مدت زمان
۴ ساعت و ۵۴ دقیقه
هزینه آموزش
۷۸,۰۰۰ تومان
محتوای این آموزش
تضمین کیفیت
۱ بازخورد (مشاهده نظرات)
آموزش یادگیری تقویتی ویژه مهندسی کنترل

در کنترل تطبیقی هدف این است که پارامترهای کنترل‌کننده با تغییر دینامیک سیستم طوری تغییر داده شوند که رفتار سیستم حلقه‌ بسته همچنان بهینه و مطلوب باشد. در تئوری یادگیری ماشینی به کنترل‌کننده در اصطلاح عامل یا Agent گفته می‌شود که وظیفه آن تنظیم سیگنال‌های کنترلی است به شکلی که خروجی‌های سیستم همانند سیگنال مطلوب تغییر کند. سیگنال‌های کنترلی طبیعتا به پلنت (Plant) اعمال خواهند شد که در اصطلاح یادگیری تقویتی به آن محیط (Environment) می‌گوییم.

آموزش یادگیری تقویتی ویژه مهندسی کنترل

مدت زمان
۴ ساعت و ۵۴ دقیقه
هزینه آموزش
۷۸,۰۰۰ تومان
محتوای این آموزش
۱ بازخورد (مشاهده نظرات)
مدرس
امید زندی

دانشجوی دکتری تخصصی مهندسی برق – کنترل

ایشان موفق به کسب رتبه اول (مدال طلا) المپیاد علمی دانشجویی مهندسی برق کشور در سال ۹۴ و همچنین رتبه سوم (مدال برنز) المپیاد علمی دانشجویی کشوری در سال ۱۳۹۳ در رشته برق شده‌اند و در زمینه تدریس آنلاین دروس مهندسی برق، کنترل، الکترونیک و ریاضیات جزء فعال‌ترین مدرسین فرادرس به شمار می‌روند.

چکیده آموزش


توضیحات تکمیلی

هر موجود زنده‌ای با محیط اطراف خودش تعامل دارد و از این برهمکنش به منظور انجام عمل‌هایی استفاده می‌کند که منجر به بقا و بهبود آن شوند. چارلز داروین نشان داد که گونه‌های مختلف عمل‌های خود را بر اساس تعامل با محیط طوری اصلاح می‌کنند که در طولانی مدت منجر به انتخاب طبیعی و بقای بهترین‌ها شود. به تغییر رفتار یک موجود زنده و یا یک شی (مانند ربات) بر اساس تعامل با محیط یادگیری تقویتی یا Reinforcement Learning می‌گوییم.

روش‌های مختلفی برای یادگیری وجود دارد. دسته اول یادگیری نظارت‌شده است که در آن داده‌های لیبل‌دار به عامل نشان داده می‌شود تا یاد بگیرد. گروه دوم یادگیری نظارت‌نشده است که در آن خود عامل باید الگوهای موجود بین داده‌ها را استخراج کند و در حقیقت لیبلی نداریم. اما دسته سوم یادگیری تقویتی است که عامل فقط از طریق تعامل با محیط می‌تواند یاد بگیرد. الگوریتم‌های یادگیری تقویتی بر این مبنا استوار هستند که عمل‌های خوب در موقعیت‌های خاص باید به خاطر سپرده شوند تا مجددا در آینده استفاده شوند. از این رو یادگیری تقویتی ارتباط خیلی نزدیکی با کنترل تطبیقی (Adaptive Control) دارد.

در کنترل تطبیقی هدف این است که پارامترهای کنترل‌کننده با تغییر دینامیک سیستم طوری تغییر داده شوند که رفتار سیستم حلقه‌ بسته همچنان بهینه و مطلوب باشد. در تئوری یادگیری ماشینی به کنترل‌کننده در اصطلاح عامل یا Agent گفته می‌شود که وظیفه آن تنظیم سیگنال‌های کنترلی است به شکلی که خروجی‌های سیستم همانند سیگنال مطلوب تغییر کند. سیگنال‌های کنترلی طبیعتا به پلنت (Plant) اعمال خواهند شد که در اصطلاح یادگیری تقویتی به آن محیط (Environment) می‌گوییم.

بنابراین کنترل‌کننده تطبیقی مبتنی بر یادگیری تقویتی، یک کنترل‌کننده بهینه است که فقط از طریق تعامل با محیط، سیگنال‌های کنترلی بهینه را تولید می‌کند و همانند بسیاری از الگوریتم‌های یادگیری تقویتی، شناختی از محیط ندارد و فقط می‌تواند با آن تعامل داشته باشد. در مهندسی کنترل، استراتژی‌های خیلی زیادی برای کنترل تطبیقی ارائه شده است که در تمام آن‌ها فرض اساسی، داشتن مدل دینامیکی سیستم است. اما در کنترل تطبیقی مبتنی بر یادگیری تقویتی، بدون داشتن دینامیک سیستم به طراحی کنترل‌کننده‌های بهینه خواهیم پرداخت.

لازم به ذکر است که پیش‌نیاز این آموزش دروس کنترل بهینه، کنترل مدرن و یادگیری تقویتی با متلب است که در فرادرس نیز وجود دارد و علاقه‌مندان بعد از رعایت پیش‌نیازها می‌توانند بهترین استفاده را از این آموزش ببرند.

فهرست سرفصل‌ها و رئوس مطالب مطرح شده در این مجموعه آموزشی، در ادامه آمده است:
  • فصل یکم: مقدمه‌ای بر یادگیری تقویتی
    • درس یکم: مقدمه‌ای بر یادگیری تقویتی – بخش یکم
    • درس دوم: مقدمه‌ای بر یادگیری تقویتی – بخش دوم
    • درس سوم: فرایندهای تصمیم‌گیری مارکوف – بخش یکم
    • درس چهارم: فرایندهای تصمیم‌گیری مارکوف – بخش دوم
  • فصل دوم: مساله تنظیم درجه دوم خطی گسسته (DT LQR)
    • درس پنجم: حل تحلیلی مساله LQR برای سیستم گسسته‌زمان
    • درس ششم: کدنویسی LQR گسسته‌زمان – بخش یکم
    • درس هفتم: کدنویسی LQR گسسته‌زمان – بخش دوم
    • درس هشتم: الگوریتم تکرار سیاست – بخش یکم
    • درس نهم: الگوریتم تکرار سیاست – بخش دوم
    • درس دهم: الگوریتم‌های تکرار ارزش و تکرار سیاست تعمیم‌یافته
    • درس یازدهم: حل مساله LQR زمان‌گسسته با تفاضلات مکانی
    • درس دوازدهم: کدنویسی الگوریتم تفاضلات مکانی
    • درس سیزدهم: حل مساله LQR زمان‌گسسته با Q Learning
    • درس چهاردهم: Q learning برای سیستم‌های غیر خطی گسسته – بخش یکم
    • درس پانزدهم: Q learning برای سیستم‌های غیر خطی گسسته – بخش دوم
    • درس شانزدهم: Q learning برای سیستم‌های غیر خطی گسسته – بخش سوم
  • فصل سوم: مساله تنظیم درجه دوم خطی پیوسته (CT LQR)
    • درس هفدهم: مساله تنظیم درجه دوم خطی پیوسته‌زمان – بخش یکم
    • درس هجدهم: مساله تنظیم درجه دوم خطی پیوسته‌زمان – بخش دوم
  • فصل چهارم: مساله ردیابی درجه دوم خطی (LQT)
    • درس نوزدهم: مساله ردیابی درجه دوم خطی – بخش یکم
    • درس بیستم: مساله ردیابی درجه دوم خطی – بخش دوم
    • درس بیست‌ویکم: مساله ردیابی درجه دوم خطی – بخش سوم
    • درس بیست‌ودوم: مساله ردیابی درجه دوم خطی – بخش چهارم

مفید برای رشته‌های
  • مهندسی برق - کنترل
  • مهندسی برق - قدرت
  • مهندسی رباتیک
  • مهندسی مکانیک
  • مهندسی مکاترونیک
  • مهندسی شیمی
  • مهندسی راه‌آهن

پیش نیاز


آنچه در این آموزش خواهید دید:

آموزش ویدئویی مورد تائید فرادرس
فایل برنامه ها و پروژه های اجرا شده
فایل PDF یادداشت‌ های ارائه مدرس

نرم افزارهای مرتبط با آموزش

MATLAB 2021a




پیش نمایش‌ها

۱. مقدمه‌ای بر یادگیری تقویتی – بخش یکم

توجه: اگر به خاطر سرعت اینترنت، کیفیت نمایش پایین‌تر از کیفیت HD ویدئو اصلی باشد؛ می‌توانید ویدئو را دانلود و مشاهده کنید دانلود پیش‌نمایش - حجم: ۶ مگابایت -- (کلیک کنید +))

۲. مقدمه‌ای بر یادگیری تقویتی – بخش دوم

توجه: اگر به خاطر سرعت اینترنت، کیفیت نمایش پایین‌تر از کیفیت HD ویدئو اصلی باشد؛ می‌توانید ویدئو را دانلود و مشاهده کنید دانلود پیش‌نمایش - حجم: ۸ مگابایت -- (کلیک کنید +))

۳. فرایندهای تصمیم‌گیری مارکوف – بخش یکم

توجه: اگر به خاطر سرعت اینترنت، کیفیت نمایش پایین‌تر از کیفیت HD ویدئو اصلی باشد؛ می‌توانید ویدئو را دانلود و مشاهده کنید دانلود پیش‌نمایش - حجم: ۸ مگابایت -- (کلیک کنید +))

۴. فرایندهای تصمیم‌گیری مارکوف – بخش دوم
مشاهده این پیش‌نمایش، نیازمند عضویت و ورود به سایت (+) است.
۵. حل تحلیلی مساله LQR برای سیستم گسسته‌زمان
مشاهده این پیش‌نمایش، نیازمند عضویت و ورود به سایت (+) است.
۶. کدنویسی LQR گسسته‌زمان – بخش یکم
مشاهده این پیش‌نمایش، نیازمند عضویت و ورود به سایت (+) است.
۷. کدنویسی LQR گسسته‌زمان – بخش دوم
مشاهده این پیش‌نمایش، نیازمند عضویت و ورود به سایت (+) است.
۸. الگوریتم تکرار سیاست – بخش یکم
مشاهده این پیش‌نمایش، نیازمند عضویت و ورود به سایت (+) است.
۹. الگوریتم تکرار سیاست – بخش دوم
مشاهده این پیش‌نمایش، نیازمند عضویت و ورود به سایت (+) است.
۱۰. الگوریتم‌های تکرار ارزش و تکرار سیاست تعمیم‌یافته
مشاهده این پیش‌نمایش، نیازمند عضویت و ورود به سایت (+) است.
این آموزش شامل ۲۳ جلسه ویدئویی با مجموع ۴ ساعت و ۵۴ دقیقه است.
با تهیه این آموزش، می‌توانید به همه بخش‌ها و جلسات آن، دسترسی داشته باشید.

راهنمای سفارش آموزش‌ها

آیا می دانید که تهیه یک آموزش از فرادرس و شروع یادگیری چقدر ساده است؟

(راهنمایی بیشتر +)

در مورد این آموزش یا نحوه تهیه آن سوالی دارید؟
  • با شماره تلفن واحد مخاطبین ۵۷۹۱۶۰۰۰ (پیش شماره ۰۲۱) تماس بگیرید. - تمام ساعات اداری
  • با ما مکاتبه ایمیلی داشته باشید (این لینک). - میانگین زمان پاسخ دهی: ۳۰ دقیقه


اطلاعات تکمیلی

نام آموزش آموزش یادگیری تقویتی ویژه مهندسی کنترل
ناشر فرادرس
کد آموزش FVEE0052
مدت زمان ۴ ساعت و ۵۴ دقیقه
زبان فارسی
نوع آموزش آموزش ویدئویی (نمایش آنلاین + دانلود)
حجم دانلود ۵۷۸ مگابایت (کیفیت ویدئو HD با فشرده سازی انحصاری فرادرس)


تضمین کیفیت و گارانتی بازگشت هزینه
توجه: کیفیت این آموزش توسط فرادرس تضمین شده است. در صورت عدم رضایت از آموزش، به انتخاب شما:
  • ۱۰۰ درصد مبلغ پرداختی در حساب کاربری شما شارژ می‌شود.
  • و یا ۷۰ درصد مبلغ پرداختی به حساب بانکی شما بازگشت داده می‌شود.





نظرات

تا کنون ۱۲۸ نفر از این آموزش استفاده کرده اند و ۱ نظر ثبت شده است.
مهدی
مهدی

آموزش عالی بود انصافا.
این اوضاع کرونا بهتر شد، فرادرس یه برنامه گردهمایی لطفا بزاره بیایم این استاد زندی رو از نزدیک ببینیم!
دمت گرم استاد، خیلی خوب بود.

برچسب‌ها:
تکرار سیاست برای یادگیری تقویتی انتگرالی | تکرار سیاست تعمیم ‌یافته | خطای تفاضلات نقطه‌ ای | عملکرد بهینه هدفمند | فرایندهای مارکوف محدود | فرمولاسیون پیوسته معادلات بلمن | فرمولاسیون یادگیری تقویتی | کدنویسی تکرار ارزش در متلب | کدنویسی تکرار سیاست در متلب | کدنویسی کنترل‌ کننده ‌ها در متلب | کنترل تطبیقی | کنترل تطبیقی با تفاضلات نقطه ‌ای | کنترل تطبیقی با یادگیری تقویتی | کنترل خطی درجه دوم گسسته | محیط و عامل | مساله LQR برای سیستم ‌های خطی گسسته | مساله نقطه ثابت | معادلات بلمن | معادلات بهینگی بلمن | معادله جبری ریکاتی برای مساله LQR | مقدمه ‌ای بر یادگیری تقویتی | یادگیری با تفاضلات نقطه‌‌ ای | یادگیری با ساختار Actor-Critic | یادگیری تقویتی | یادگیری تقویتی انتگرالی
مشاهده بیشتر مشاهده کمتر

×
فهرست جلسات ۲۳ جلسه ویدئویی