lmdeploy v0.11.0 发布:功能增强、性能优化与Bug修复详解 🚀 新功能(Featu

lmdeploy v0.11.0 发布:功能增强、性能优化与Bug修复详解
🚀 新功能(Features)
• 新增 /abort_request 接口,可用于中断正在进行的请求。
• 引入 Qwen3 系列支持,包括 Qwen3-VL 模型。
• 支持通过扁平化 bucket tensor 的方式同步权重。
• 支持面向 MoE(Mixture of Experts)模型的分组路由机制。
• 增加返回路由专家用于复用的功能,减少重复计算。
• 引入上下文并行(context parallel)支持,提高推理效率。
• 新增 fope 功能模块。
• 增加推测式解码(speculative decoding)支持。
• MoE 模型 bf16 精度执行引擎优化。
#大模型# #福大大架构师每日一题#
全部评论

相关推荐

不愿透露姓名的神秘牛友
03-19 10:38
实力求职者:真的绷不住了,第一张霸总人设,第二张求生欲拉满
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务