最近实测了苹果M3 Ultra运行DeepSeek R1满血版的性能表现,结果显示其速度超过了8卡的A100,表现出强大的计算能力和性能优势,这一表现令人瞩目,预示着苹果M系列处理器在高性能计算领域的强大潜力。
B站UP主“虽然但是张黑黑”分享了一段令人瞩目的视频,展示了苹果最新处理器M3 Ultra的惊人性能,在测试中,搭载满血版M3 Ultra的Mac Studio成功运行了规模为6710亿参数的DeepSeek R1模型,结果显示,其性能竟然超越了由8张A100显卡组成的服务器,且成本更为亲民。
运行如此大规模的模型需要依赖搭载高端显卡的专业级服务器,总价往往超过百万元,这对于普通用户而言是一笔巨大的开支,使用搭载满血版M3 Ultra的Mac Studio却能达到类似的效果,这无疑大大提高了性价比。
测试数据显示,在运行DeepSeek R1模型时,虽然M3 Ultra在GGUF格式下的性能略低于8张A100显卡的16.41 Tokens/s,但在MLX格式下,其速度提升至惊人的19.17 Tokens/s,成功超越了由多张A100显卡组成的服务器,在进行DeepSeek V3模型的测试时,M3 Ultra的速度也达到了令人瞩目的水平。
值得注意的是,尽管M3 Ultra在某些场景下表现出色,但它并非在所有情况下都能超越A100显卡,在进行单一模型推理时,主要依赖内存带宽和容量,此时A100显卡的潜力无法得到充分发挥,但在多用户推理和大模型训练场景下,M3 Ultra的优势则更为明显,在大语言模型推理速度测试中,无论是Llama 3.1 70B、Gemma2 27B还是Qwen 2.5 14B模型,M3 Ultra都展现出了出色的性能表现。
此次测试中使用的满血版M3 Ultra配备了高达512GB的统一内存,总价为人民币74,249元,对于大多数用户而言,如果不需要运行如此大规模的模型,可以选择降低统一内存容量以节省成本,M3 Ultra的性能表现令人印象深刻,为未来的计算应用带来了无限可能,它的出色表现不仅限于特定的任务或场景,而是为各种计算密集型任务提供了强大的支持,随着技术的不断进步和发展,我们有理由相信未来的计算设备将更加高效、强大和便捷。