快科技 12 月 13 日音书,早在四年前,AMD 就曾设定主义,到 2025 年 EPYC 系列就业器处理器和 Instinct 系列 AI 芯片的能效,较 2020 年提高 30 倍。如今,MI300X AI 芯片基本上结束主义,时间提了早一年。
据 THW 报说念,AMD 两个 64 中枢 EPYC 9575F CPU、八个 Instinct MI300X AI 芯片及 2304GB DDR5 内存的就业器,Llama3.1-70B(vLLM 0.6.1.post2、TP8)测试推感性能,用一组复杂联想详情系统动力后果,并与 2020 年的旧机器比较,
放弃高慢,新纯真力后果是旧机的 28.3 倍。
不外,AMD 并未显露 2020 年的旧机是何规格。但约略率是 EPYC 7002 系列,Zen 2 架构,每个 CPU 最多 64 个中枢,以及 CDNA 1 架构 Instinct MI100 AI 芯片。
AMD 默示,除了强力硬件矫正,更高性能后果是架构进步,加上软件优化聚合,是卓绝式进展。
本年 10 月份的 Advancing AI 2024 大会上,AMD 进展发布了新款 AI 芯片—— GPU 加快卡" Instinct MI325X "。它在大获到手的 MI300X 基础上再进一步,主淌若增强了 HBM 内存部分。
MI325X 配备了多达 256GB HBM3E 内存,比拟于 MI300X 又加多了 64GB。
MI325X 也支撑八块并行构成一个平台,这就有多达 2TB HBM3E、48TB/s 带宽,总的性能高达 FP16 10.4 PFlops ( 每秒 1.04 亿亿次 ) 、FP8 20.8 PFlops ( 每秒 2.08 亿亿次 ) 。
对比 NVIDIA H200,不管单卡也曾八卡平台,不同大模子推理的性能王人不错最初 20-40%。
磨真金不怕火性能方面,单卡可最初 H200 10%,八卡平台则是执平。
MI325X 加快卡和平台将在四季度内投产,而巴合伙伴的整机系统、基础架构惩处决策,将从来岁第一季度起清楚推出。
现金九游体育app平台