ollama v0.18.0正式发布:云模型无缝直连、Claude Code自动压缩窗口、错误处理与

ollama v0.18.0正式发布:云模型无缝直连、Claude Code自动压缩窗口、错误处理与交互体验全面升级

1. 云模型全面接入:
• 现在无需通过 ollama pull 下载云模型,只需在模型名称后添加 :cloud 标签,即可自动连接云端模型。
• 系统在调用 ollama run  时,会自动拉取云模型的“stub”信息,完成兼容性适配。
• 改进了模型源的传播逻辑,在创建云模型衍生版本时维护明确的来源标识。
2. Claude代码增强:
• 新增支持设置 Compaction Window(压缩窗口)功能,针对 Claude Code 云模型自动设定窗口大小以优化上下文处理。
• 对 Claude 本地与云模型环境变量装载进行了精细优化,确保自动选择正确模型与上下文。
3. OpenAI兼容API增强:
• 文档新增了 reasoning_effort 参数支持说明,可在推理型模型中控制推理强度("high"、"medium"、"low"、"none")。
• 完善了推理/thinking控制字段,实现对推理模型的细粒度策略控制。
4. 命令行功能升级:
• 改进模型排序及启动行为,优化 TUI(终端交互界面)中的选项逻辑。
• “--yes” 无头模式强化:在不交互的环境中可自动批准并拉取缺失模型。
• 新增云模型检测与自动补全机制,使显式云模型在列表中同样被 ollama ls 正确识别。
5. 中间件与服务器改进:
• middleware 层在处理非 JSON 错误时可自动回退字节错误提示,避免解析错误干扰。
• 新增 zstd 解压支持,在云代理中间件可自动解码压缩请求体,实现高效传输。
• 限制最大解压后体积(20MB),防止超大请求导致资源消耗。
• 改进云代理 passthrough 流程,检测 Content-Encoding: zstd 并清除标头后运行。
#大模型# #福大大架构师每日一题#
全部评论

相关推荐

02-16 01:39
南昌大学 Java
重剑Ds:感觉不太可能 后端都减飞了 根本不缺人
点赞 评论 收藏
分享
评论
1
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务