Mojoodi A, Naraghi M, Moradi M. Online solution of the Hamilton–Jacobi–Bellman equation for nonlinear systems with unknown drift dynamics using neural network. Modares Mechanical Engineering 2017; 16 (10) :241-252
URL:
http://mme.modares.ac.ir/article-15-9392-fa.html
موجودی آرمان، نراقی مهیار، مرادی مجتبی. حل برخط معادله ی همیلتون-ژاکوبی-بلمن برای سیستم های غیرخطی با دینامیک داخلی نامعلوم با استفاده از شبکه ی عصبی. مهندسی مکانیک مدرس. ۱۳۹۵; ۱۶ (۱۰) :۲۴۱-۲۵۲
URL: http://mme.modares.ac.ir/article-۱۵-۹۳۹۲-fa.html
۱- دانشکده مکانیک، دانشگاه صنعتی امیرکبیر (پلی تکنیک تهران)
۲- دانشیار دانشکده مهندسی مکانیک، دانشگاه صنعتی امیرکبیر (پلی تکنیک تهران)
۳- دانشکده مهندسی مکانیک، دانشگاه صنعتی امیرکبیر (پلی تکنیک تهران)
چکیده: (۸۱۴۵ مشاهده)
در این مقاله روشی برای حل برخط معادله ی همیلتون-ژاکوبی-بلمن به منظور طراحی کنترلر بهینه برای سیستم های غیرخطی زمان پیوسته ارائه شده است. دیدگاه اساسی در این روش استفاده از تجربیات برای تقویت کنترلر می باشد، که با عنوان یادگیری تقویتی معروف است. ابتدا بر اساس ساختار عملگر- ارزیاب و به صورت برخط با استفاده از دو شبکه ی عصبی مجزا، معادله ی همیلتون-ژاکوبی-بلمن به صورت تقریبی حل می شود. شبکه های عملگر و ارزیاب به ترتیب قانون کنترل بهینه و تابع ارزش بهینه را تخمین می زنند. سپس با استفاده از گرادیان نزولی این تخمین ها بهبود می یابند. از آنجاکه مدل کردن و تعیین مواردی چون اصطکاک و میرایی پیچیده و مشکل می باشد، از یک شبکه ی عصبی-مقاوم به منظور تخمین دینامیک داخلی سیستم استفاده شده است. به این ترتیب ساختار نهایی، عملگر- ارزیاب- شناساگر می باشد که با استفاده از آن بدون نیاز به دانستن دینامیک داخلی سیستم، معادله ی همیلتون-ژاکوبی-بلمن حل و کنترلر بهینه طراحی می شود. پایداری روش ارائه شده با استفاده از تابع لیاپانوف اثبات شده است. کارایی روش ارائه شده به صورت عملی برای سیستم خطی موتور DC و با شبیه سازی برای یک سیستم غیرخطی نشان داده شده است. نتایج، عملکرد مناسب روش ارائه شده برای حل معادله ی همیلتون-ژاکوبی-بلمن نشان می دهد.
نوع مقاله:
مقاله پژوهشی کامل |
موضوع مقاله:
کنترل دریافت: 1395/4/1 | پذیرش: 1395/6/6 | انتشار: 1395/7/24