福大大架构师每日一题

03-04 07:52 北京动视元科技有限公司_产品中心_研发工程师

发布于北京

关注

ollama v0.17.5正式发布：新增Qwen3.5系列模型，全方位优化GPU/CPU分配、采样

ollama v0.17.5正式发布：新增Qwen3.5系列模型，全方位优化GPU/CPU分配、采样惩罚与内存管理机制详解

一、版本核心更新概览
1. 新增模型系列：Qwen3.5
v0.17.5引入了全新的模型系列——Qwen3.5，包括 0.8B、2B、4B 与 9B 四个参数规模版本。这使得开发者能根据硬件资源灵活选择不同性能梯度的模型。

值得注意的是，在此次版本中，Qwen3.5模型支持 GPU 与 CPU 混合加载模式，同时针对模型“自我重复”问题进行了深度修复。新模型可通过命令重新下载：

ollama pull qwen3.5:35b
2. GPU & CPU分配相关修复
新版本修复了Qwen3.5模型在GPU与CPU拆分运行时的崩溃问题。此前，当模型部分参数映射至CPU后，DeltaNet层或KV缓存命中时容易出现panic，如今通过对线性注意力张量缺失、conv1d权重校验、层级递归验证进行系统修复，显著提升了混合资源下的运行稳定性。

二、性能与内存系统全面升级
1. Verbose模式新增峰值内存统计
ollama run --verbose 现在会显示峰值内存使用情况。新增的参数结构 Metrics 中增加了：

• PeakMemory：以GiB或人类可读格式输出峰值内存；
• formatPeakMemory()函数：自动判断单位并格式化显示；
• Summary()方法中新增内存输出逻辑。
这可以帮助开发者在分析模型运行性能时，即时观察峰值占用，便于评估MLX引擎的内存优化效果。

2. MLX运行器内存修复与优化
MLX runner一系列补丁包括：

• 修复了在KV缓存命中时引发panic的问题；
• 报告真实内存使用，而非理论分配值；
• 增加错误传播机制，通过api.StatusError将pipeline异常上报到客户端；
• 严格限制模型上下文长度以防越界；
• 优化prompt评估计时逻辑，使计时与计数更精确；
• 引入内存峰值复位API mlx_reset_peak_memory()。
这一系列操作让MLX在处理大模型时更稳定，也为后续GPU监控功能奠定基础。
#大模型# #福大大架构师每日一题#

全部评论

推荐最新楼层

03-06 14:46

郑州大学 Java

Java中的定时任务

在Java中，主要有两种方式实现定时任务：使用java.util包中的Timer和TimerTask。使用Java并发包中的ScheduledExecutorService。Timer和TimerTaskTimerTask：表示一个定时任务，它是一个抽象类，实现了Runnable，具体的定时任务需要继承该类，实现run方法。Timer是一个具体类，它负责定时任务的调度和执行运行一次： //在指定绝对时间time运行任务task public void schedule(TimerTask task, Date time) //在当前时间延时delay毫秒后运行任务task public voi...

27届毕业生-Java知...

点赞评论收藏

分享

03-04 20:44

清华大学 Java

小公司其实也可以去，假如薪资不错也不加班

小公司其实也值得去，如果薪资合理且不加班，性价比很高。小公司团队小，机会多，可以快速接触业务全流程，积累实战经验。沟通直接，学习曲线陡峭，容易被认可和赋予责任。同时，生活和工作平衡也更容易保持。对于希望提升技能、锻炼独立解决问题能力的新人，小公司往往比大公司更灵活、更适合成长。

小厂一定不能去吗？

点赞评论收藏

分享

01-31 21:01

河南科技大学 Java

27届简历求拷打

项目其实就是外卖跟点评，ai润色了一下就想在暑期实习之前找个中小厂这种程度足够吗

简历中的项目经历要怎么写

点赞评论收藏

分享

02-26 11:47

大连科技学院测试工程师

26届本科，这样的简历春招能拿到offer吗

点赞评论收藏

分享

昨天 01:02

门头沟学院数据分析师

求拷打简历，面数据分析，求求了

三月的小目标

点赞评论收藏

分享

评论

1

收藏

招聘动态

恒生电子

2026届春季校园招聘

网易游戏雷火

27届精英实习&26届补招开启！

EA China

2026校园新锐招聘计划

搜狐畅游

26届春招火热进行中

OPPO

2027届寻梦实习招聘

高通

2026实习生招聘

27届校招宝典

AI网申助手

网申字段一键填写

米哈游2026校园招聘

应届生春招&全年实习生专项

滴滴

2026届春季校招

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 春招 / 实习投递，你最焦虑的一件事 #

3972次浏览 58人参与

# HR问：你期望的薪资是多少？如何回答 #

80026次浏览 677人参与

# 神州信息求职进展汇总 #

4656次浏览 74人参与

# 今年找实习到底有多难？ #

2421次浏览 31人参与

# 27届求职交流 #

19946次浏览 406人参与

# 今天你投了哪些公司？ #

1901次浏览 60人参与

# 26届求职交流 #

10033次浏览 262人参与

# 工作丧失热情的瞬间 #

366680次浏览 2557人参与

# 快手求职进展汇总 #

737578次浏览 7115人参与

# 双非能在秋招上岸吗？ #

378211次浏览 1875人参与

# 国企/银行/研究所公司爆料 #

195126次浏览 900人参与

# 三月的小目标 #

30368次浏览 570人参与

# 实习要如何选择和准备？ #

147790次浏览 1569人参与

# 听劝，这个公司值得去吗 #

678715次浏览 2000人参与

# 交出你的校招焚诀 #

21670次浏览 333人参与

# 面试___岗的必刷题单 #

24217次浏览 436人参与

# 哪些公司开暑期实习了？ #

39671次浏览 316人参与

# 面试中，你被问过哪些奇葩问题？ #

89067次浏览 850人参与

# 你觉得mentor喜欢什么样的实习生 #

51780次浏览 1009人参与

# 求职遇到的搞笑事件 #

165286次浏览 902人参与

# 24秋招避雷总结 #

953848次浏览 7052人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务