مهندسی مکانیک مدرس

مهندسی مکانیک مدرس

ارائه الگوریتم جدید توماس شطرنجی برای حل دستگاه معادلات سه‌قطری روی پردازنده‌گرافیکی

نویسندگان
1 عضو هیات علمی گروه مهندسی مکانیک دانشگاه بیرجند
2 دانشجوی کارشناسی ارشد مهندسی مکانیک دانشگاه بیرجند
چکیده
پردازنده گرافیکی همه منظوره کاربر را قادر می‌سازد تا از پردازنده گرافیکی برای مقاصد محاسباتی عمومی بهره بگیرد. استفاده از این نوع پردازنده‌ها موجب افزایش قابل توجهی در سرعت محاسبات عددی می‌شود. تحقیقات متعددی جهت بررسی مزیت استفاده از پردازنده گرافیکی در محاسبات از جمله بکار‌گیری آن برای حل دستگاه معادلات سه‌قطری صورت گرفته است. تمرکز اصلی تحقیقات مذکور، روی ارتقاء شیوه‌های بهره گیری از الگوریتم‌های موازی، نظیر کاهش متناوب و کاهش متناوب موازی بوده است. این الگوریتم‌ها با معماری پردازنده گرافیکی سازگارند، با این وجود پیچیدگی محاسباتی بالایی نسبت به الگوریتم توماس سری دارند و دارای محدودیت‌هایی در خصوص ابعاد دستگاه معادلات می‌باشند. بنابراین در تحقیق حاضر با توجه به مزایای الگوریتم توماس نسبت به الگوریتم‌های موازی، شیوه‌ای نوین با عنوان توماس شطرنجی جهت سازگار کردن الگوریتم توماس برای اجرا روی پردازنده گرافیکی ارائه شده است. این روش برای حل مسئله هدایت پایای دو‌بعدی استفاده شده و نتایج نشان‌دهنده افزایش دقت پاسخ نسبت به دو الگوریتم توماس و کاهش متناوب موازی می‌باشد. همچنین نتایج حاکی از آن است که روش جدید می‌تواند نسبت به الگوریتم توماس، بین 5.7 تا 22.2 افزایش سرعت محاسباتی را در پی داشته باشد. بعلاوه نتایج نشان‌می‌دهد که سرعت این روش به طور میانگین در حدود 2 برابر الگوریتم کاهش متناوب موازی می‌باشد. همچنین مشاهده شد که دسترسی غیر‌هم‌مکان به حافظه سراسری موجب حداقل و حداکثر کاهش سرعت 42.7 و 81.9 درصد به ترتیب برای اندازه شبکه 128×128 و 1024×1024 می‌شود.
کلیدواژه‌ها

عنوان مقاله English

Developing new Checkerboard Thomas algorithm for solving tridiagonal set of equations on GPU

نویسندگان English

Seyed Alireza Zolfaghari 1
Ali Foadaddini 2
چکیده English

General Purpose Graphics Processing Unite (GPGPU) allows the user to utilize GPU for general computing purposes. Using these processors can cause a great speedup in numerical calculations. Several studies have been performed to investigate the advantages of using the GPGPU in numerical calculations including solving tridiagonal set of equations. The main focus of the mentioned studies was on improving parallel methods for example CR and PCR algorithms. Although these algorithms are consistent with GPU architecture, they have higher arithmetic complexity compared with serial Thomas algorithm and also they have limitations in dimensions of the equations’ set. Therefore, in the present study, according to the advantages of Thomas algorithm compared with the parallel algorithms, a novel method entitled checkerboard Thomas has been developed to accommodate Thomas algorithm for running on GPU. This method has been used for solving 2D steady heat conduction problem and the results show an increase in the solution precision compared to Thomas and PCR algorithms. Also the results indicate that the new algorithm can cause to computing speedup between 5.7 to 22.2x, compared with Thomas algorithm. Furthermore, results show that the new method is about 2x faster than PCR algorithm. Also it has been seen that speed decrement for uncoalesced access to global memory is 42.7% in minimum and 81.9% in maximum for 128×128 and 1024×1024 grid size, respectively.

کلیدواژه‌ها English

Checkerboard Thomas algorithm
GPGPU
tridiagonal set of equations
PCR method