Modares Mechanical Engineering
مهندسی مکانیک مدرس
Modares Mechanical Engineering
Engineering & Technology
http://mme.modares.ac.ir
1
admin
1027-5940
2476-6909
10.22034/mme
fa
jalali
1395
1
1
gregorian
2016
4
1
16
2
online
1
fulltext
fa
ارائه الگوریتم جدید توماس شطرنجی برای حل دستگاه معادلات سهقطری روی پردازندهگرافیکی
Developing new Checkerboard Thomas algorithm for solving tridiagonal set of equations on GPU
پردازنده گرافیکی همه منظوره کاربر را قادر میسازد تا از پردازنده گرافیکی برای مقاصد محاسباتی عمومی بهره بگیرد. استفاده از این نوع پردازندهها موجب افزایش قابل توجهی در سرعت محاسبات عددی میشود. تحقیقات متعددی جهت بررسی مزیت استفاده از پردازنده گرافیکی در محاسبات از جمله بکارگیری آن برای حل دستگاه معادلات سهقطری صورت گرفته است. تمرکز اصلی تحقیقات مذکور، روی ارتقاء شیوههای بهره گیری از الگوریتمهای موازی، نظیر کاهش متناوب و کاهش متناوب موازی بوده است. این الگوریتمها با معماری پردازنده گرافیکی سازگارند، با این وجود پیچیدگی محاسباتی بالایی نسبت به الگوریتم توماس سری دارند و دارای محدودیتهایی در خصوص ابعاد دستگاه معادلات میباشند. بنابراین در تحقیق حاضر با توجه به مزایای الگوریتم توماس نسبت به الگوریتمهای موازی، شیوهای نوین با عنوان توماس شطرنجی جهت سازگار کردن الگوریتم توماس برای اجرا روی پردازنده گرافیکی ارائه شده است. این روش برای حل مسئله هدایت پایای دوبعدی استفاده شده و نتایج نشاندهنده افزایش دقت پاسخ نسبت به دو الگوریتم توماس و کاهش متناوب موازی میباشد. همچنین نتایج حاکی از آن است که روش جدید میتواند نسبت به الگوریتم توماس، بین 5.7 تا 22.2 افزایش سرعت محاسباتی را در پی داشته باشد. بعلاوه نتایج نشانمیدهد که سرعت این روش به طور میانگین در حدود 2 برابر الگوریتم کاهش متناوب موازی میباشد. همچنین مشاهده شد که دسترسی غیرهممکان به حافظه سراسری موجب حداقل و حداکثر کاهش سرعت 42.7 و 81.9 درصد به ترتیب برای اندازه شبکه 128×128 و 1024×1024 میشود.
General Purpose Graphics Processing Unite (GPGPU) allows the user to utilize GPU for general computing purposes. Using these processors can cause a great speedup in numerical calculations. Several studies have been performed to investigate the advantages of using the GPGPU in numerical calculations including solving tridiagonal set of equations. The main focus of the mentioned studies was on improving parallel methods for example CR and PCR algorithms. Although these algorithms are consistent with GPU architecture, they have higher arithmetic complexity compared with serial Thomas algorithm and also they have limitations in dimensions of the equations’ set. Therefore, in the present study, according to the advantages of Thomas algorithm compared with the parallel algorithms, a novel method entitled checkerboard Thomas has been developed to accommodate Thomas algorithm for running on GPU. This method has been used for solving 2D steady heat conduction problem and the results show an increase in the solution precision compared to Thomas and PCR algorithms. Also the results indicate that the new algorithm can cause to computing speedup between 5.7 to 22.2x, compared with Thomas algorithm. Furthermore, results show that the new method is about 2x faster than PCR algorithm. Also it has been seen that speed decrement for uncoalesced access to global memory is 42.7% in minimum and 81.9% in maximum for 128×128 and 1024×1024 grid size, respectively.
الگوریتم توماس شطرنجی,پردازنده گرافیکی همه منظوره,دستگاه معادلات سهقطری,الگوریتم کاهش متناوب موازی
Checkerboard Thomas algorithm,GPGPU,tridiagonal set of equations,PCR method
309
318
http://mme.modares.ac.ir/browse.php?a_code=A-15-1000-2687&slc_lang=fa&sid=15
Seyed Alireza
Zolfaghari
سیدعلیرضا
ذوالفقاری
100319475328460061209
100319475328460061209
Yes
عضو هیات علمی گروه مهندسی مکانیک دانشگاه بیرجند
Ali
Foadaddini
علی
فؤادالدینی
100319475328460061210
100319475328460061210
No
دانشجوی کارشناسی ارشد مهندسی مکانیک دانشگاه بیرجند