معرفی کلی
این کارت گرافیک مخصوص دیتاسنترها و محاسبات سنگین طراحی شده است و برای اجرای بازی یا کاربری خانگی ساخته نشده. تمرکز اصلی آن روی هوش مصنوعی، مدلهای زبانی بزرگ (LLMs) و محاسبات علمی با حجم داده بسیار بالا است.
معماری و پردازنده گرافیکی
بر پایه معماری Hopper (GH100) ساخته شده است.
فرآیند تولید 5 نانومتری TSMC با 80 میلیارد ترانزیستور.
اندازه تراشه 814 میلیمتر مربع.
واحدهای پردازشی
دارای 16896 واحد سایهزن، 528 واحد TMU و 24 واحد ROP.
شامل 528 هسته Tensor نسل چهارم برای پردازش هوش مصنوعی.
حافظه
مجهز به 141 گیگابایت حافظه HBM3e با پهنای باس 6144 بیت.
پهنای باند حافظه 4.8 ترابایت بر ثانیه است که سرعت انتقال داده بسیار بالایی را فراهم میکند.
فرکانس کاری
فرکانس پایه 1365 مگاهرتز و فرکانس بوست 1785 مگاهرتز.
توان پردازشی نظری
توان محاسباتی FP16 برابر با 241.3 ترافلاپس.
توان محاسباتی FP32 برابر با 60.32 ترافلاپس.
توان محاسباتی FP64 برابر با 30.16 ترافلاپس.
توان مصرفی و طراحی
توان مصرفی (TDP) برابر با 600 وات.
نیازمند کانکتور برق 8-pin EPS و منبع تغذیه پیشنهادی 1000 وات.
طراحی دو اسلاتی با طول 267 میلیمتر و ارتفاع 111 میلیمتر.
ویژگیها و قابلیتها
فاقد خروجی تصویر و مخصوص دیتاسنترها.
پشتیبانی از CUDA 9.0 و OpenCL 3.0.
اتصال از طریق PCIe 5.0 x16.
کاربردها
بهینهسازی برای هوش مصنوعی مولد (Generative AI).
تسریع مدلهای زبانی بزرگ مانند GPT-3 و Llama2.
کاربرد در محاسبات علمی و شبیهسازیهای سنگین HPC.
تا 2 برابر سرعت بیشتر در استنتاج LLM نسبت به H100.
تا 110 برابر سرعت بیشتر در HPC نسبت به CPUها.
نظرات یا سوالات خود را در مورد این کالا با ما در میان بگذارید.