دوره 16، شماره 2 - ( 2-1395 )                   جلد 16 شماره 2 صفحات 318-309 | برگشت به فهرست نسخه ها

XML English Abstract Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

Zolfaghari S A, Foadaddini A. Developing new Checkerboard Thomas algorithm for solving tridiagonal set of equations on GPU. Modares Mechanical Engineering 2016; 16 (2) :309-318
URL: http://mme.modares.ac.ir/article-15-3532-fa.html
ذوالفقاری سیدعلیرضا، فؤادالدینی علی. ارائه الگوریتم جدید توماس شطرنجی برای حل دستگاه معادلات سه‌قطری روی پردازنده‌گرافیکی. مهندسی مکانیک مدرس. 1395; 16 (2) :309-318

URL: http://mme.modares.ac.ir/article-15-3532-fa.html


1- عضو هیات علمی گروه مهندسی مکانیک دانشگاه بیرجند
2- دانشجوی کارشناسی ارشد مهندسی مکانیک دانشگاه بیرجند
چکیده:   (6091 مشاهده)
پردازنده گرافیکی همه منظوره کاربر را قادر می‌سازد تا از پردازنده گرافیکی برای مقاصد محاسباتی عمومی بهره بگیرد. استفاده از این نوع پردازنده‌ها موجب افزایش قابل توجهی در سرعت محاسبات عددی می‌شود. تحقیقات متعددی جهت بررسی مزیت استفاده از پردازنده گرافیکی در محاسبات از جمله بکار‌گیری آن برای حل دستگاه معادلات سه‌قطری صورت گرفته است. تمرکز اصلی تحقیقات مذکور، روی ارتقاء شیوه‌های بهره گیری از الگوریتم‌های موازی، نظیر کاهش متناوب و کاهش متناوب موازی بوده است. این الگوریتم‌ها با معماری پردازنده گرافیکی سازگارند، با این وجود پیچیدگی محاسباتی بالایی نسبت به الگوریتم توماس سری دارند و دارای محدودیت‌هایی در خصوص ابعاد دستگاه معادلات می‌باشند. بنابراین در تحقیق حاضر با توجه به مزایای الگوریتم توماس نسبت به الگوریتم‌های موازی، شیوه‌ای نوین با عنوان توماس شطرنجی جهت سازگار کردن الگوریتم توماس برای اجرا روی پردازنده گرافیکی ارائه شده است. این روش برای حل مسئله هدایت پایای دو‌بعدی استفاده شده و نتایج نشان‌دهنده افزایش دقت پاسخ نسبت به دو الگوریتم توماس و کاهش متناوب موازی می‌باشد. همچنین نتایج حاکی از آن است که روش جدید می‌تواند نسبت به الگوریتم توماس، بین 5.7 تا 22.2 افزایش سرعت محاسباتی را در پی داشته باشد. بعلاوه نتایج نشان‌می‌دهد که سرعت این روش به طور میانگین در حدود 2 برابر الگوریتم کاهش متناوب موازی می‌باشد. همچنین مشاهده شد که دسترسی غیر‌هم‌مکان به حافظه سراسری موجب حداقل و حداکثر کاهش سرعت 42.7 و 81.9 درصد به ترتیب برای اندازه شبکه 128×128 و 1024×1024 می‌شود.
متن کامل [PDF 1118 kb]   (5380 دریافت)    
نوع مقاله: مقاله پژوهشی کامل | موضوع مقاله: دینامیک سیالات محاسباتی
دریافت: 1394/9/10 | پذیرش: 1394/10/18 | انتشار: 1394/11/26

ارسال نظر درباره این مقاله : نام کاربری یا پست الکترونیک شما:
CAPTCHA

بازنشر اطلاعات
Creative Commons License این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.