ollama v0.17.4发布:Qwen 3.5与LFM 2全新登场,稳定工具调用索引机制全面升级
ollama v0.17.4发布:Qwen 3.5与LFM 2全新登场,稳定工具调用索引机制全面升级!一文读懂最新改动与技术细节
一、版本概览与关键更新
1. 新模型发布简介
在 v0.17.4 中,Ollama官方引入了两个重量级的模型家族:
• Qwen 3.5:
这一新系列是开源的多模态模型家族,具备出色的实用性与性能表现。它延续了 Qwen 系列的强项,在文本、视觉等不同模态任务中都有极高的表现力,兼具开放性与高效性。
• LFM 2:
LFM2 是一类混合型模型家族,专为设备端部署(on-device deployment)设计。其重点成员 LFM2-24B-A2B 拥有高达 240亿 参数的规模,在保证模型推理效率的前提下,将架构进行有效扩展,从而实现更高的本地计算性能。
这标志着 Ollama 在本地模型与云端模型之间的融合迈出了关键一步——不仅支持更大的参数规模,同时为多模态与本地推理场景提供了优化支持。
2. 并行工具调用索引机制升级(Tool Call Indexing)
v0.17.4 的核心更新之一是:
“Tool call indices will now be included in parallel tool calls”
这意味着在进行多工具调用的场景中,每一次工具调用(Tool Call)都会带有独立且稳定的索引(Index)值。这一机制的引入,保证了多线程或流式调用环境下,调用顺序能够明确追踪,不会出现索引错乱的情况。对于需要依赖多工具协同的模型(例如 Qwen3、GLM4.6、GLM4.7 等),该功能的提升显著增强了解析的稳定性与保证测试的一致性。
#大模型# #福大大架构师每日一题#
一、版本概览与关键更新
1. 新模型发布简介
在 v0.17.4 中,Ollama官方引入了两个重量级的模型家族:
• Qwen 3.5:
这一新系列是开源的多模态模型家族,具备出色的实用性与性能表现。它延续了 Qwen 系列的强项,在文本、视觉等不同模态任务中都有极高的表现力,兼具开放性与高效性。
• LFM 2:
LFM2 是一类混合型模型家族,专为设备端部署(on-device deployment)设计。其重点成员 LFM2-24B-A2B 拥有高达 240亿 参数的规模,在保证模型推理效率的前提下,将架构进行有效扩展,从而实现更高的本地计算性能。
这标志着 Ollama 在本地模型与云端模型之间的融合迈出了关键一步——不仅支持更大的参数规模,同时为多模态与本地推理场景提供了优化支持。
2. 并行工具调用索引机制升级(Tool Call Indexing)
v0.17.4 的核心更新之一是:
“Tool call indices will now be included in parallel tool calls”
这意味着在进行多工具调用的场景中,每一次工具调用(Tool Call)都会带有独立且稳定的索引(Index)值。这一机制的引入,保证了多线程或流式调用环境下,调用顺序能够明确追踪,不会出现索引错乱的情况。对于需要依赖多工具协同的模型(例如 Qwen3、GLM4.6、GLM4.7 等),该功能的提升显著增强了解析的稳定性与保证测试的一致性。
#大模型# #福大大架构师每日一题#
全部评论
相关推荐
点赞 评论 收藏
分享


查看16道真题和解析