
IT之家 6 月 11 日音问疯狂的邻居韩国电影中字,科技媒体 Wccftech 昨日(6 月 10 日)发布博文,报谈称在 2026 年大众设备者大会(WWDC)上,推出 CoreAI 引擎,接替 2017 年推出的 CoreML 框架,主打端侧大模子推理。
IT之家征引博文先容,CoreML 框架已入伍 9 年,主要面向图像分类等微型静态任务;而最新接棒的 CoreAI 主要面向端侧土产货推理和角落 AI 场景,要点优化建筑端大言语模子推理,要点援助更生动的模子法子和更大的模子内存占用。
而 MLX 是苹果生态中的一个机器学习框架,更偏向连络、考验和微调任务,常被设备者拿来测试和部署土产货大模子。
从首批基准来看疯狂的邻居韩国电影中字,苹果 CoreAI 呈现“小模子强、大模子接近抓平”特征。在 M4 Mac 上驱动 Qwen3 0.6B 模子后,CoreAI 解码速率约为 MLX 的 2.47 倍。在 iPhone 17 Pro 上,这一上风约为 1.6 倍。
解码速率指大言语模子生成文本时,每秒能输出些许个 token,《家访女教师》电影免费观看国语常写稿 tok/s。这个目的越高,模子酬谢常常越快,用户恭候工夫越短。

在模子范畴擢升至 80 亿参数(Qwen3 8B,M4 Max)后,CoreAI 比 MLX 快 5%,两者解码性能真实抓平,意味着 CoreAI 的性能上风随模子范畴增大而收窄。
在抓续负载方面,测试裸露,iPhone 17 Pro 的 GPU 在长工夫驱动后会较快触发温控降频,这会减轻 GPU 阶梯的抓续费解。CoreML 合营苹果神经引擎(ANE,Apple Neural Engine)的组合在性能保抓率方面竣事反超。

横向对比其他厂商决策,针对特定模子深度优化的引擎还是更容易胜出。比如,谷歌的 LiteRT-LM 驱动 Gemma 时,在 iPhone 17 Pro 上达到每秒 55.4 tokens,况且 RAM 占用仅 641 MB;行为对照,苹果 MLX 的内存占用为 2900 MB,是前者的 4.5 倍。

