جستجو در مقالات منتشر شده
۱ نتیجه برای موجودی
آرمان موجودی، مهیار نراقی، مجتبی مرادی،
دوره ۱۶، شماره ۱۰ - ( ۱۰-۱۳۹۵ )
چکیده
در این مقاله روشی برای حل برخط معادله ی همیلتون-ژاکوبی-بلمن به منظور طراحی کنترلر بهینه برای سیستم های غیرخطی زمان پیوسته ارائه شده است. دیدگاه اساسی در این روش استفاده از تجربیات برای تقویت کنترلر می باشد، که با عنوان یادگیری تقویتی معروف است. ابتدا بر اساس ساختار عملگر- ارزیاب و به صورت برخط با استفاده از دو شبکه ی عصبی مجزا، معادله ی همیلتون-ژاکوبی-بلمن به صورت تقریبی حل می شود. شبکه های عملگر و ارزیاب به ترتیب قانون کنترل بهینه و تابع ارزش بهینه را تخمین می زنند. سپس با استفاده از گرادیان نزولی این تخمین ها بهبود می یابند. از آنجاکه مدل کردن و تعیین مواردی چون اصطکاک و میرایی پیچیده و مشکل می باشد، از یک شبکه ی عصبی-مقاوم به منظور تخمین دینامیک داخلی سیستم استفاده شده است. به این ترتیب ساختار نهایی، عملگر- ارزیاب- شناساگر می باشد که با استفاده از آن بدون نیاز به دانستن دینامیک داخلی سیستم، معادله ی همیلتون-ژاکوبی-بلمن حل و کنترلر بهینه طراحی می شود. پایداری روش ارائه شده با استفاده از تابع لیاپانوف اثبات شده است. کارایی روش ارائه شده به صورت عملی برای سیستم خطی موتور DC و با شبیه سازی برای یک سیستم غیرخطی نشان داده شده است. نتایج، عملکرد مناسب روش ارائه شده برای حل معادله ی همیلتون-ژاکوبی-بلمن نشان می دهد.