نسل بعدی مرکز داده Behemoth، پردازنده گرافیکی Instinct MI300 MCM ‘GFX940’، اولین حضور در پچ لینوکس را ممکن می کند.

به نظر می رسد نسل بعدی شتاب دهنده پردازنده گرافیکی Instinct MI300 AMD در آخرین پچ لینوکس برای اولین بار ظاهر شده است.

پردازنده گرافیکی AMD Instinct MI300 ‘GFX940’، شتاب دهنده مرکز داده MCM نسل بعدی، اولین حضور در پچ لینوکس را ممکن می کند
آخرین پچ لینوکس یک هدف جدید برای GP منتشر نشده AMD ‘GFX940’ که دارای یک ISA مشابه با GPU Aldebaran ‘GFX90a’ است، ارائه کرده است. حدس زده می‌شود که این تراشه می‌تواند نسل بعدی شتاب‌دهنده پردازنده گرافیکی Instinct MI300 AMD را تامین کند و از تمام ویژگی‌های مبتنی بر داده مانند MFMA (Matrix-Fused-Multiply-Add)، FP64 با نرخ کامل و عملیات FP32 پشتیبانی می‌کند. ویژگی های دیگر نیز شامل XNACK است که به قول Coelacanth-Dream مخصوص یکپارچه سازی فضای حافظه CPU+GPU است.

منبع بیان می کند که اگرچه GPU ISA مشابه است، اما GFX940 در مقایسه با GPU های Aldebaran ‘CDNA 2’ که در زیر لیست شده اند، تفاوت های کمی دارد:

AMD GFX90a and GFX940 GPUs for next-gen Instinct accelerators feature comparison. (Image Credits: Coelacanth-Dream)

شایعات قبلی حاکی از آن بود که AMD Instinct MI300 دارای طراحی 4-GCD بر اساس معماری جدید CDNA 3 خواهد بود. Instinct MI200 آینده قرار بود دارای 128 واحد محاسباتی در هر قالب باشد، اما از شایعه هفته گذشته به 110 واحد محاسباتی تغییر کرده است. در مجموع 220 واحد محاسباتی 14080 هسته را تشکیل می دهند و اگر عدد دقیق را در نظر بگیریم و آن را در 4 ضرب کنیم (تعداد GCD در Instinct MI300)، در نهایت به 440 واحد محاسباتی یا 28160 هسته دیوانه وار خواهیم رسید.

به‌روزرسانی اخیر AMD ROCm Developer Tools که توسط Komachi مشاهده شد، حداکثر 4 پردازنده گرافیکی MCM را تأیید کرد، اما آنها فقط SKUهای Aldebaran هستند. انتظار می رود حداقل چهار شتاب دهنده Instinct مجهز به CDNA 2 به همراه (شناسه های منحصر به فرد) مربوطه در زیر وجود داشته باشد. توجه داشته باشید که این عدد نشان دهنده تعداد تلفات در هر دستگاه نیست، بلکه نشان دهنده خود دستگاه است:

  • 0x7408
  • 0x740C
  • 0x740F
  • 0x7410
AMD Instinct MI200 Aldebaran CDNA 2 GPU Device IDs

حالا اگر AMD هیچ تغییری در هنگام انتقال از CDNA 2 به CDNA 3 ایجاد نکند، درست است، اما اینطور نیست. انتظار می‌رود CDNA 3 معماری جدید اصلاح‌شده‌ای را ارائه کند که دیگر مشتقات Vega مانند Arcturus یا Aldebaran نخواهد بود که این شایعه را باورپذیرتر می‌کند.

معماری GPU همچنین ممکن است از طرح‌بندی استفاده کند که ممکن است در نهایت شبیه به آرایش جدید WGP/SE در تراشه‌های جدید RDNA 3 یا طراحی کاملاً جدید متناسب با بخش HPC باشد. اما یک چیز مسلم است، این پردازنده‌های گرافیکی چهارگانه MCM قطعا چیزی هستند که ما نمی‌توانیم منتظر باشیم تا در عمل ببینیم!

AMD Radeon Instinct Accelerators 2020

Accelerator NameAMD Instinct MI300AMD Instinct MI250XAMD Instinct MI250AMD Instinct MI210AMD Instinct MI100AMD Radeon Instinct MI60AMD Radeon Instinct MI50AMD Radeon Instinct MI25AMD Radeon Instinct MI8AMD Radeon Instinct MI6
GPU ArchitectureTBA (CDNA 3)Aldebaran (CDNA 2)Aldebaran (CDNA 2)Aldebaran (CDNA 2)Arcturus (CDNA 1)Vega 20Vega 20Vega 10Fiji XTPolaris 10
GPU Process NodeAdvanced Process Node6nm6nm6nm7nm FinFET7nm FinFET7nm FinFET14nm FinFET28nm14nm FinFET
GPU Dies4 (MCM)?2 (MCM)2 (MCM)1 (MCM)1 (Monolithic)1 (Monolithic)1 (Monolithic)1 (Monolithic)1 (Monolithic)1 (Monolithic)
GPU Cores28,160?14,08013,3126656768040963840409640962304
GPU Clock SpeedTBA1700 MHz1700 MHz~1700 MHz?~1500 MHz1800 MHz1725 MHz1500 MHz1000 MHz1237 MHz
FP16 ComputeTBA383 TOPs362 TOPs~176 TOPs185 TFLOPs29.5 TFLOPs26.5 TFLOPs24.6 TFLOPs8.2 TFLOPs5.7 TFLOPs
FP32 ComputeTBA95.7 TFLOPs90.5 TFLOPs~44 TFLOPs23.1 TFLOPs14.7 TFLOPs13.3 TFLOPs12.3 TFLOPs8.2 TFLOPs5.7 TFLOPs
FP64 ComputeTBA47.9 TFLOPs45.3 TFLOPs~22 TFLOPs11.5 TFLOPs7.4 TFLOPs6.6 TFLOPs768 GFLOPs512 GFLOPs384 GFLOPs
VRAMTBA128 GB HBM2e128 GB HBM2e64 GB HBM2e32 GB HBM232 GB HBM216 GB HBM216 GB HBM24 GB HBM116 GB GDDR5
Memory ClockTBA3.2 Gbps3.2 Gbps3.2 Gbps?1200 MHz1000 MHz1000 MHz945 MHz500 MHz1750 MHz
Memory BusTBA8192-bit8192-bit4096-bit4096-bit bus4096-bit bus4096-bit bus2048-bit bus4096-bit bus256-bit bus
Memory BandwidthTBA3.2 TB/s3.2 TB/s1.6 TB/s1.23 TB/s1 TB/s1 TB/s484 GB/s512 GB/s224 GB/s
Form FactorTBAOAMOAMDual Slot CardDual Slot, Full LengthDual Slot, Full LengthDual Slot, Full LengthDual Slot, Full LengthDual Slot, Half LengthSingle Slot, Full Length
CoolingTBAPassive CoolingPassive CoolingPassive CoolingPassive CoolingPassive CoolingPassive CoolingPassive CoolingPassive CoolingPassive Cooling
TDPTBA560W500W?300W?300W300W300W300W175W150W

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

سبد خرید

ورود به حساب کاربری