疯狂的邻居韩国电影中字苹果CoreAI首批基准出炉，Qwen3 0.6B大幅跳跃，8B真实追平MLX

发布日期：2026-06-12 18:27 点击次数：175

IT之家 6 月 11 日音问疯狂的邻居韩国电影中字，科技媒体 Wccftech 昨日（6 月 10 日）发布博文，报谈称在 2026 年大众设备者大会（WWDC）上，推出 CoreAI 引擎，接替 2017 年推出的 CoreML 框架，主打端侧大模子推理。

IT之家征引博文先容，CoreML 框架已入伍 9 年，主要面向图像分类等微型静态任务；而最新接棒的 CoreAI 主要面向端侧土产货推理和角落 AI 场景，要点优化建筑端大言语模子推理，要点援助更生动的模子法子和更大的模子内存占用。

而 MLX 是苹果生态中的一个机器学习框架，更偏向连络、考验和微调任务，常被设备者拿来测试和部署土产货大模子。

从首批基准来看疯狂的邻居韩国电影中字，苹果 CoreAI 呈现“小模子强、大模子接近抓平”特征。在 M4 Mac 上驱动 Qwen3 0.6B 模子后，CoreAI 解码速率约为 MLX 的 2.47 倍。在 iPhone 17 Pro 上，这一上风约为 1.6 倍。

解码速率指大言语模子生成文本时，每秒能输出些许个 token，《家访女教师》电影免费观看国语常写稿 tok／s。这个目的越高，模子酬谢常常越快，用户恭候工夫越短。

在模子范畴擢升至 80 亿参数（Qwen3 8B，M4 Max）后，CoreAI 比 MLX 快 5%，两者解码性能真实抓平，意味着 CoreAI 的性能上风随模子范畴增大而收窄。

在抓续负载方面，测试裸露，iPhone 17 Pro 的 GPU 在长工夫驱动后会较快触发温控降频，这会减轻 GPU 阶梯的抓续费解。CoreML 合营苹果神经引擎（ANE，Apple Neural Engine）的组合在性能保抓率方面竣事反超。

横向对比其他厂商决策，针对特定模子深度优化的引擎还是更容易胜出。比如，谷歌的 LiteRT-LM 驱动 Gemma 时，在 iPhone 17 Pro 上达到每秒 55.4 tokens，况且 RAM 占用仅 641 MB；行为对照，苹果 MLX 的内存占用为 2900 MB，是前者的 4.5 倍。