مهندسی مکانیک مدرس

مهندسی مکانیک مدرس

شبیه‌سازی و ردیابی مسیر کوادروتور با جبران‌سازی اثر باد به کمک یادگیری تقویتی

نوع مقاله : مقاله پژوهشی

نویسندگان
1 دانشجوی دکترا، مهندسی مکانیک طراحی کاربردی،مرکز سیستم ها و فناوری های پیشرفته، دانشگاه تهران، تهران
2 دانشجوی کارشناسی ارشد، مهندسی مکانیک طراحی کاربردی، دانشگاه تربیت مدرس، تهران، ایران
10.48311/mme.2026.117781.82894
چکیده
هدف این پژوهش، طراحی کنترل‌کننده هـوشمند برای دستیابـی به ردیابـی مسیرهای مختلف کوادروتور در محیط‌هایی با بادهای متغیـر می‌باشد. به این منظور ابتدا به مدل‌سازی دینامیکی کوادروتور پرداخته شد. مدل‌سازی باد نیز با اضافه کردن شتاب باد در صفحه‌ی افقی به معادلات دینامیکی انتقالی پرنده انجام شد. سپس، با هدف کنترل دقیق موقعیت و جهت‌گیری کوادروتور در حضور اغتشاشات محیطی باد، چارچوبی ترکیبی طراحی شد که شامل یک کنترل‌کننده‌ی پایه‌ PID، یک تنظیم‌کننده‌ی ضرایب مبتنی بر یادگیری تقویتی و یک مشاهده‌گر اغتشاش به‌همراه جبران‌ساز آن بود. برای تنظیم تطبیقی ضرایب کنترل‌کننده PID حین ردیابی مسیر از‌ الگوریتـم‌های DDPG وTD3 یادگیری تقویتی بهره برده شد. در نهایت جهت ارزیابی عملکرد چارچوب کنترلی، آزمایش‌های مختلفی در شرایط بدون باد و با شدت‌های مختلف باد در مسیرهای مختلف پروازی انجام شد. نتایـج شبیه‌سازی‌های انجام گرفته نشان دادند که در محیط‌هایی با بادهای متغیـر، اضافه شدن مشاهده‌گر و جبران‌ساز به کنتـرل‌کننده PID با ضرایب ثابت 15% خطا را نسبت به PID، و کنتـرل‌کننده PID تنظیم‌شده با الگوریتم‌های یادگیری تقویتی همراه با مشاهده‌گر و جبران‌ساز نسبت به حالت ضریب ثابت 25% خطای ردیابی را کاهش داد. در مسیر بی‌نهایت الگوریتم DDPG، %10 بهینه‌تر از الگوریتم TD3، در مسیر دایروی الگوریتم TD3 %5 بهینه‌تر از الگوریتم DDPG، و در مسیرهای مارپیچ نیز الگوریتم DDPG، %20 بهینه‌تر از الگوریتم TD3 عمل کرد.
کلیدواژه‌ها

موضوعات


عنوان مقاله English

Quadrotor simulation and trajectory tracking with wind-effect compensation using reinforcement learning

نویسندگان English

Majid Sadedel 1
Zahra Darestani Farahani 2
2 Mechanics, Tarbiat Modares, Tehran, Iran
چکیده English

The aim of this research is to design an intelligent controller capable of achieving accurate trajectory tracking of a quadrotor in environments with varying wind conditions. To this end, the dynamic modeling of the quadrotor was first carried out. Wind modeling was also implemented by adding horizontal wind acceleration to the translational dynamic equations of the vehicle.

Next, to ensure precise position and attitude control of the quadrotor in the presence of wind disturbances, a hybrid control framework was designed, consisting of a baseline proportional–integral–derivative (PID) controller, a reinforcement learning–based gain tuner, and a disturbance observer along with its compensator. For adaptive tuning of the PID gains during trajectory tracking, the DDPG and TD3 reinforcement learning algorithms were utilized.

Finally, to evaluate the performance of the control framework, various experiments were conducted under no-wind conditions and under different wind intensities across multiple trajectories. The simulation results indicated that in environments with varying wind, adding the observer and compensator to a fixed-gain PID controller reduced the tracking error by 15% compared to the standalone PID controller. Additionally, PID control with reinforcement learning–based gain tuning, combined with the observer and compensator, reduced tracking error by 25% compared to the fixed-gain case. In the lemniscate trajectory, the DDPG algorithm performed 10% better than TD3; in the circular trajectory, the TD3 algorithm performed 5% better than DDPG; and in spiral trajectories, DDPG outperformed TD3 by 20%.

کلیدواژه‌ها English

Quadrotor
trajectory tracking
intelligent control
wind-effect compensation
reinforcement learning

مقالات آماده انتشار، پذیرفته شده
انتشار آنلاین از 19 فروردین 1405