16.08 tokens/s,功耗不到170w
7w,比h100便宜
来源
【速度媲美官网?满血M3 Ultra推理6000亿参数DeepSeek R1】 https://www.bilibili.com/video/BV1nkRnYTEWx/
这个人也测试了,单用户本地推理的话性价比真挺高
苹果是全球科技公司的标杆,马斯克是全球骗子的标杆
哪里有评测 q4 量化和 q8 量化的差距?