苹果最新推出的M3 Ultra芯片在Mac Studio中展现出惊艳性能,竟然能流畅运行拥有6710亿参数的DeepSeek R1模型。这款超大规模AI模型需要高达404GB的内存容量,但M3 Ultra凭借独特的统一内存架构,以低功耗和高效率挑战业界极限,让人感到惊叹不已。

M3 Ultra的成功关键在于苹果的统一内存架构。传统上,运行像DeepSeek R1这样拥有6710亿参数的模型需要强大的GPU和大量显存,但M3 Ultra将系统内存与处理器共享,形成一个高带宽内存池,让AI模型能像使用显存一样高效运作。
YouTube频道Dave2D的测试显示,M3 Ultra不仅性能出色,还能在功耗上大幅领先竞争对手。DeepSeek R1模型的404GB内存需求对传统PC来说是个挑战,通常需要多张GPU协作才能顺利运行,功耗会飙升至数百甚至上千瓦。然而,M3 Ultra在Mac Studio中仅需不到200W的功耗,就能稳定处理这款巨型模型,在能源效率上遥遥领先传统多GPU配置。


为充分发挥DeepSeek R1的潛力,M3 Ultra需要顶规512GB内存配置。Dave Lee通过Terminal手动将内存上限提升至448GB,才让模型顺利运行。值得一提的是,这次测试使用的是4-bit量化的R1版本,虽牺牲了一些精度,但保留完整6710亿参数。即便如此,M3 Ultra依然展现出惊人效能,证明其在处理超大规模模型时的硬实力。
令人意外的是,6710亿参数的DeepSeek R1在M3 Ultra上的表现,竟然优于较小的7亿参数版本。这可能与模型架构的优化有关,使大规模参数在苹果硬件生态中获得更好发挥空间。这种”以大博大”的表现显示,M3 Ultra不仅能应付当前需求,更有潜力挑战未来AI运算极限。