ollama v0.21.1发布:Kimi CLI原生集成、MLX推理性能飞跃、多模态长程任务能力全

ollama v0.21.1发布:Kimi CLI原生集成、MLX推理性能飞跃、多模态长程任务能力全面进化

Ollama v0.21.1 版本的更新覆盖范围广泛,涉及命令行工具、模型管理、推理引擎、API 接口、文档等多个模块,具体可分为以下几大板块:

• 新增 Kimi Code CLI 集成,支持自动安装、配置与运行,实现 Moonshot coding agent 与 Ollama 模型的无缝联动;
• MLX Runner 全面优化,包括采样器重构、张量管理线程安全优化、推理管道优化、logprobs 支持完善等;
• 模型推荐与管理优化,更新推荐模型列表,调整模型排序规则,完善云模型上下文长度限制;
• Hermes Agent 文档重构,优化快速启动流程,调整推荐模型说明,简化配置步骤;
• API 接口修复,解决 gemma4 模型在禁用 thinking 时格式约束失效的问题,完善 logprobs 相关接口;
• 模型相关优化,包括 gemma4、glm4_moe_lite 等模型的细节修复与功能完善。
本次更新不涉及新增功能模块,全部围绕现有功能的优化与完善展开,重点解决了此前版本中存在的性能瓶颈、功能缺陷与体验痛点,尤其针对 MLX 推理引擎的优化,让搭载 Apple Silicon 芯片的设备运行本地模型时获得更出色的性能表现。
#大模型# #福大大架构师每日一题#
全部评论

相关推荐

饼子吃到撑:学院本是这样的,找工作拼运气,你技术再好人家筛选学历照样沉入海底,海投就行了
点赞 评论 收藏
分享
小牛炒肉:好大的官威居然不是什么官
点赞 评论 收藏
分享
评论
1
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务