به نظر می رسد نسل بعدی شتاب دهنده پردازنده گرافیکی Instinct MI300 AMD در آخرین پچ لینوکس برای اولین بار ظاهر شده است.
پردازنده گرافیکی AMD Instinct MI300 ‘GFX940’، شتاب دهنده مرکز داده MCM نسل بعدی، اولین حضور در پچ لینوکس را ممکن می کند
آخرین پچ لینوکس یک هدف جدید برای GP منتشر نشده AMD ‘GFX940’ که دارای یک ISA مشابه با GPU Aldebaran ‘GFX90a’ است، ارائه کرده است. حدس زده میشود که این تراشه میتواند نسل بعدی شتابدهنده پردازنده گرافیکی Instinct MI300 AMD را تامین کند و از تمام ویژگیهای مبتنی بر داده مانند MFMA (Matrix-Fused-Multiply-Add)، FP64 با نرخ کامل و عملیات FP32 پشتیبانی میکند. ویژگی های دیگر نیز شامل XNACK است که به قول Coelacanth-Dream مخصوص یکپارچه سازی فضای حافظه CPU+GPU است.
منبع بیان می کند که اگرچه GPU ISA مشابه است، اما GFX940 در مقایسه با GPU های Aldebaran ‘CDNA 2’ که در زیر لیست شده اند، تفاوت های کمی دارد:
شایعات قبلی حاکی از آن بود که AMD Instinct MI300 دارای طراحی 4-GCD بر اساس معماری جدید CDNA 3 خواهد بود. Instinct MI200 آینده قرار بود دارای 128 واحد محاسباتی در هر قالب باشد، اما از شایعه هفته گذشته به 110 واحد محاسباتی تغییر کرده است. در مجموع 220 واحد محاسباتی 14080 هسته را تشکیل می دهند و اگر عدد دقیق را در نظر بگیریم و آن را در 4 ضرب کنیم (تعداد GCD در Instinct MI300)، در نهایت به 440 واحد محاسباتی یا 28160 هسته دیوانه وار خواهیم رسید.
بهروزرسانی اخیر AMD ROCm Developer Tools که توسط Komachi مشاهده شد، حداکثر 4 پردازنده گرافیکی MCM را تأیید کرد، اما آنها فقط SKUهای Aldebaran هستند. انتظار می رود حداقل چهار شتاب دهنده Instinct مجهز به CDNA 2 به همراه (شناسه های منحصر به فرد) مربوطه در زیر وجود داشته باشد. توجه داشته باشید که این عدد نشان دهنده تعداد تلفات در هر دستگاه نیست، بلکه نشان دهنده خود دستگاه است:
- 0x7408
- 0x740C
- 0x740F
- 0x7410
حالا اگر AMD هیچ تغییری در هنگام انتقال از CDNA 2 به CDNA 3 ایجاد نکند، درست است، اما اینطور نیست. انتظار میرود CDNA 3 معماری جدید اصلاحشدهای را ارائه کند که دیگر مشتقات Vega مانند Arcturus یا Aldebaran نخواهد بود که این شایعه را باورپذیرتر میکند.
معماری GPU همچنین ممکن است از طرحبندی استفاده کند که ممکن است در نهایت شبیه به آرایش جدید WGP/SE در تراشههای جدید RDNA 3 یا طراحی کاملاً جدید متناسب با بخش HPC باشد. اما یک چیز مسلم است، این پردازندههای گرافیکی چهارگانه MCM قطعا چیزی هستند که ما نمیتوانیم منتظر باشیم تا در عمل ببینیم!
AMD Radeon Instinct Accelerators 2020
Accelerator Name | AMD Instinct MI300 | AMD Instinct MI250X | AMD Instinct MI250 | AMD Instinct MI210 | AMD Instinct MI100 | AMD Radeon Instinct MI60 | AMD Radeon Instinct MI50 | AMD Radeon Instinct MI25 | AMD Radeon Instinct MI8 | AMD Radeon Instinct MI6 |
---|---|---|---|---|---|---|---|---|---|---|
GPU Architecture | TBA (CDNA 3) | Aldebaran (CDNA 2) | Aldebaran (CDNA 2) | Aldebaran (CDNA 2) | Arcturus (CDNA 1) | Vega 20 | Vega 20 | Vega 10 | Fiji XT | Polaris 10 |
GPU Process Node | Advanced Process Node | 6nm | 6nm | 6nm | 7nm FinFET | 7nm FinFET | 7nm FinFET | 14nm FinFET | 28nm | 14nm FinFET |
GPU Dies | 4 (MCM)? | 2 (MCM) | 2 (MCM) | 1 (MCM) | 1 (Monolithic) | 1 (Monolithic) | 1 (Monolithic) | 1 (Monolithic) | 1 (Monolithic) | 1 (Monolithic) |
GPU Cores | 28,160? | 14,080 | 13,312 | 6656 | 7680 | 4096 | 3840 | 4096 | 4096 | 2304 |
GPU Clock Speed | TBA | 1700 MHz | 1700 MHz | ~1700 MHz? | ~1500 MHz | 1800 MHz | 1725 MHz | 1500 MHz | 1000 MHz | 1237 MHz |
FP16 Compute | TBA | 383 TOPs | 362 TOPs | ~176 TOPs | 185 TFLOPs | 29.5 TFLOPs | 26.5 TFLOPs | 24.6 TFLOPs | 8.2 TFLOPs | 5.7 TFLOPs |
FP32 Compute | TBA | 95.7 TFLOPs | 90.5 TFLOPs | ~44 TFLOPs | 23.1 TFLOPs | 14.7 TFLOPs | 13.3 TFLOPs | 12.3 TFLOPs | 8.2 TFLOPs | 5.7 TFLOPs |
FP64 Compute | TBA | 47.9 TFLOPs | 45.3 TFLOPs | ~22 TFLOPs | 11.5 TFLOPs | 7.4 TFLOPs | 6.6 TFLOPs | 768 GFLOPs | 512 GFLOPs | 384 GFLOPs |
VRAM | TBA | 128 GB HBM2e | 128 GB HBM2e | 64 GB HBM2e | 32 GB HBM2 | 32 GB HBM2 | 16 GB HBM2 | 16 GB HBM2 | 4 GB HBM1 | 16 GB GDDR5 |
Memory Clock | TBA | 3.2 Gbps | 3.2 Gbps | 3.2 Gbps? | 1200 MHz | 1000 MHz | 1000 MHz | 945 MHz | 500 MHz | 1750 MHz |
Memory Bus | TBA | 8192-bit | 8192-bit | 4096-bit | 4096-bit bus | 4096-bit bus | 4096-bit bus | 2048-bit bus | 4096-bit bus | 256-bit bus |
Memory Bandwidth | TBA | 3.2 TB/s | 3.2 TB/s | 1.6 TB/s | 1.23 TB/s | 1 TB/s | 1 TB/s | 484 GB/s | 512 GB/s | 224 GB/s |
Form Factor | TBA | OAM | OAM | Dual Slot Card | Dual Slot, Full Length | Dual Slot, Full Length | Dual Slot, Full Length | Dual Slot, Full Length | Dual Slot, Half Length | Single Slot, Full Length |
Cooling | TBA | Passive Cooling | Passive Cooling | Passive Cooling | Passive Cooling | Passive Cooling | Passive Cooling | Passive Cooling | Passive Cooling | Passive Cooling |
TDP | TBA | 560W | 500W? | 300W? | 300W | 300W | 300W | 300W | 175W | 150W |