لینک دانلود و خرید پایین توضیحات
دسته بندی : پاورپوینت
نوع فایل : .PPT ( قابل ویرایش و آماده پرینت )
قسمتی از متن .PPT :
تعداد اسلاید : 24 اسلاید
قسمت اولایده های اصلی A. Broumandnia, Broumandnia@gmail.com Slide 1 1- مقدمه ای بر موازی سازی A. Broumandnia, Broumandnia@gmail.com Slide 2 1.1 موازی سازی چیست؟ A. Broumandnia, Broumandnia@gmail.com Slide 3 رشد نمایی کارایی ریزپردازنده ها را قانون مور می نامند. سرعت در هر 18 ماه دو برابر می شود. ارزیابی کارایی/ هزینه کامپیوترها A. Broumandnia, Broumandnia@gmail.com Slide 4 From:
“Robots After All,”
by H. Moravec, CACM, pp. 90-97, October 2003. Mental power in four scales نقشه ی مسیر فن آوری نیمه هادی ها A. Broumandnia, Broumandnia@gmail.com Slide 5 From the 2001 edition of the roadmap [Alla02] چرا کارایی بالا مورد نیاز است؟ A. Broumandnia, Broumandnia@gmail.com Slide 6 سرعت بالاتر(حل سریع مسائل)
پیش بینی هوا
خط مرگ نرم و سخت
گذردهی بالاتر(حل مسائل بیشتر)
پردازش تراکنش ها
قدرت محاسباتی بالاتر(حل مسائل طولانی)
پیش بینی هوا برای یک هفته در کمتر از 24 ساعت Categories of supercomputers
Uniprocessor; aka vector machine
Multiprocessor; centralized or distributed shared memory
Multicomputer; communicating via message passing
Massively parallel processor (MPP; 1K or more processors) آرگومان سرعت نور A. Broumandnia, Broumandnia@gmail.com Slide 7 سرعت نور تقریبا 30 cm/ns است.
سیگنال با یک سوم سرعت نور در سیم مسی انتقال می یابد.
اگر برای اجرای یک دستورالعمل سیگنال ها باید 1cm انتقال یابند، بنابراین این دستور حداقل در 0.1ns اجرا می شود. در نتیجه کارایی آن محدود به 10GIPS خواهد شد.
این محدودیت تا حدودی با روش های حداقل سازی معماری همانند حافظه ی نهان بر طرف می شود.
How does parallel processing help? Wouldn’t multiple processors need to communicate via signals as well? چرا با کارایی TIPS و TFLOPS نیاز است؟ A. Broumandnia, Broumandnia@gmail.com Slide 8 Reasonable running time = Fraction of hour to several hours (103-104 s)
In this time, a TIPS/TFLOPS machine can perform 1015-1016 operations Example 2: Fluid dynamics calculations (1000 1000 1000 lattice)
109 lattice points 1000 FLOP/point 10 000 time steps = 1016 FLOP Example 3: Monte Carlo simulation of nuclear reactor
1011 particles to track (for 1000 escapes) 104 FLOP/particle = 1015 FLOP Decentralized supercomputing ( from Mathworld News, 2006/4/7 ):
Grid of tens of thousands networked computers discovers 230 402 457 – 1, the 43rd Mersenne prime, as the largest known prime (9 152 052 digits ) چرا پردازش موازی نیاز است؟ A. Broumandnia, Broumandnia@gmail.com Slide 9 Parallelism = Concurrency
Doing more than one thing at a time
Has been around for decades, since early computers
I/O channels, DMA, device controllers, multiple ALUs The sense in which we use it in this course
Multiple agents (hardware units, software processes) collaborate to perfor