ollama v0.20.4 正式发布!MLX 性能大幅提升 , Gemma4 闪光注意力全面启用

ollama v0.20.4 正式发布!MLX 性能大幅提升 , Gemma4 闪光注意力全面启用

本次v0.20.4版本发布时间为2026年4月9日,核心提交集中在4月7日与4月8日,整体变更可划分为六大核心板块:

1. 底层推理加速优化:MLX框架M5性能提升、Gemma4闪光注意力启用与兼容修复
2. 模型创建流程重构:实验性路径清理、Safetensors模型导入修复与逻辑简化
3. 前端UI代码规范整改:未使用变量、常量声明、空捕获语句等语法问题修复
4. 接口能力扩展:函数调用输出数组类型支持
5. 硬件兼容强化:macOS Metal版本检测、旧GPU闪光注意力禁用、MLX库路径匹配优化
6. 测试体系完善:新增图像生成集成测试、Safetensors解析单元测试、模型创建集成测试
从代码改动规模来看,本次更新以新增功能与兼容修复为主,删除代码多为冗余逻辑与废弃路径,整体架构更加精简高效,同时大幅完善了测试覆盖,保障自定义模型、多模态模型、Safetensors格式模型的运行稳定性。
#大模型# #福大大架构师每日一题#
全部评论

相关推荐

03-03 23:42
复旦大学 Java
_无论云泥意贯一:把复旦大学放前面,山东大学放后面,并且在两个大学后面标注985(用一些显眼的颜色标注)
点赞 评论 收藏
分享
评论
1
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务