انجمن های تخصصی  فلش خور
تراشه GP100 انویدیا زیر ذره‎بین، معماری پاسکال را بهتر بشناسید - نسخه‌ی قابل چاپ

+- انجمن های تخصصی فلش خور (http://www.flashkhor.com/forum)
+-- انجمن: رایانه (http://www.flashkhor.com/forum/forumdisplay.php?fid=27)
+--- انجمن: مسائل مربوط به سخت افزار، لپتاپ، تبلت، آیفون و ... (http://www.flashkhor.com/forum/forumdisplay.php?fid=29)
+--- موضوع: تراشه GP100 انویدیا زیر ذره‎بین، معماری پاسکال را بهتر بشناسید (/showthread.php?tid=256501)



تراشه GP100 انویدیا زیر ذره‎بین، معماری پاسکال را بهتر بشناسید - Jack Daniel'ѕ - 12-04-2016

به نظر می رسد معماری ریز پردازنده گرافیکی پیش روی انویدیا با کُد Pascal یک هیولای به تمام معنا خواهد بود. اولین محصول مبتنی بر این معماری با نام Tesla P100، که یک شتاب دهنده است، طی کنفرانس GTC2016 معرفی شد. Tesla P100 توان مهیب خود را از تراشه ای با کُد GP100 می گیرد که خوشبختانه دیاگرام  بلاک آن منتشر شده و اکنون می توانیم شناخت بهتری از این تراشه و معماری Pascal داشته باشیم. در ادامه به تشریح اجزای مختلف این تراشه قدرتمند می پردازیم، با ما باشید.

تراشه GP100 انویدیا زیر ذره‎بین، معماری پاسکال را بهتر بشناسید 1
 برای شروع، GP100 همانند AMD Fiji، یک ماژول در برگیرنده چندین تراشه مختلف است. این تراشه خود در برگیرنده پردازنده گرافیکی نسبتاً بزرگ، چهار تراشه حافظه پشته سازی شده و رابط فیزیکی ویژه ای به نام interposer است که ارتباط میان پردازنده گرافیکی با تراشه های حافظه را ممکن می کند. GP100 دارای  رابط حافظه عریض 4096 بیتی HBM2 با پهنای باند اسمی 1 ترابایت بر ثانیه است. در شتاب دهنده  Tesla P100، پهنای باند حافظه 720 گیگابایت برثانیه است. ساختار تراشه GP100 بجز دو تفاوت اساسی شامل گذرگاه (باس) و حافظه، مشابه دیگر تراشه های انویدیا است. یک رابط PCI-Express gen 3.0 x16 ارتباط پردازنده گرافیکی با سیستم را ممکن می کند، موتور GigaThread بار پردازشی را بین شش خوشه پردازشی توزیع می کند. هشت کنترلر حافظه رابط عریض 4096 بیتی HBM2 را فراهم می کنند. همچنین یک کامپوننت جدید در این تراشه وجود دارد که Hub پرسرعت خوانده می شود و چهار درگاه NVLink را ارائه می کند. هنوز مشخص نیست که هر یک از این درگاه ها دارای پهنای باند حافظه 80 گیگابایت بر ثانیه هستند و یا این مقدار اعلام شده از سوی انویدیا، مجموع پهنای باند هر چهار درگاه است.
 تراشه GP100 انویدیا زیر ذره‎بین، معماری پاسکال را بهتر بشناسید 1
GP100 متشکل از شش خوشه پردازشی است. این خوشه ها زیر مجموعه هایی با استقلال بالا از پردازنده گرافیکی هستند و هر یک از آنها، تمامی اجزای لازم برای پردازش گرافیکی را داراست. با معماری Pascal و یا حداقل در تراشه GP100، هر خوشه پردازشی از 10 واحد  SM (streaming multiprocessors) تشکیل شده است. هر یک از این واحد های SM دارای 64 هسته CUDA  است. بنابراین هر خوشه پردازشی در برگیرنده 640 هسته CUDA و تراشه GP100  در مجموع دارای تعداد 3,840هسته  CUDA است. از دیگر اجزای کلیدی این پردازنده گرافیکی می توان تعداد 240 واحد آدرس دهی بافت (TMU) را برشمرد. در شتاب دهنده Tesla P100 انویدیا از 56 واحد SM از مجموع 60 واحد موجود بهره گرفته تا به 3584 هسته CUDA دست یابد، بنابراین تراشه مورد استفاده  در Tesla P100، گونه تقلیل یافته ای از GP100 است و گونه کامل (چاق) می تواند در محصول دیگری چون یک Titan و یا Quadro جدید مورد استفاده قرار گیرد.
به نظر می رسد فرکانس هسته پردازنده های گرافیکی بر پایه Pascal بسیار بالا باشد. علی‎رغم اینکه Tesla P100 برای گیمرها و یا کاربران خانگی طراحی نشده، اما فرکانس پایه هسته آن 1328 مگاهرتز است که در حالت بوست تا 1480 مگاهرتز فرا می رود و توان حرارتی به 300 وات می رسد. احتمالاً اکنون فکر می کنید 300 وات بسیار زیاد است و ما با یک تراشه داغ و پرمصرف روبرو هستیم، اما پیش از قضاوت باید در نظر داشته باشید که تراشه های حافظه از سطح برد PCB کارت گرافیک به همان قطعه سیلیکونی پردازنده گرافیکی منتقل شده اند و این یعنی تغذیه و حرارت تولید شده به حساب تراشه اصلی خواهد بود. بنابراین حرارت گیری که بر روی پردازنده گرافیکی نصب می شود، تراشه های حافظه را نیز خنک نگه خواهد داشت.
مهترین اطلاعات تراشه GP100 اینها بودند، البته قسمت های مربوط به رابط NVLink را می توان بیشتر تشریح کرد اما از آنجایی که این فناوری در کارت های گرافیک معمولی مورد استفاده قرار نمی گیرد، از آن صرف نظر می کنیم.
منبع: techpowerup و شهرسخت افزار