首页 / 福大大架构师每日一题

福大大架构师每日一题

176404次浏览 1719人互动

此刻你想和大家分享什么

热门最新

04-22 08:15

北京动视元科技有限公司_产品中心_研发工程师

agno v2.5.17 更新：文件引用可关闭、GitHub 配置支持按请求指定、流式与组件加载全面

agno v2.5.17 更新：文件引用可关闭、GitHub 配置支持按请求指定、流式与组件加载全面修复，稳定性再升级从这次更新内容来看，主要可以分为以下几个方向：1. 新增能力• 支持关闭 Claude 文件引用• 支持 GitHubConfig 仓库按请求指定2. 核心修复• 组件加载时保留自定义数据库表名• MCP 初始化时正确应用 header_provider 的请求头• 保留内部工作流事件身份，并为 agent/team 事件增加 nested_depth• 让知识库数据库在 config API 中实时构建• 停止向所有模型 provider 注入共享 HTTP/2 client• 在所有 router 流式生成器中显式捕获 CancelledError• 在清理 JSON 前先尝试原始 JSON 解析，以保留字符串中的代码块• 排除框架注入参数，避免出现在 user_input_schema 中• memory pipeline gate check 中补充 extra_messages 判断3. 其他说明• 本版本同步了相关维护和发布流程更新，整体属于一次较全面的稳定性迭代。

点赞评论收藏

04-21 08:32

北京动视元科技有限公司_产品中心_研发工程师

node v25.9.0 更新来了：测试运行器模块 Mock 大升级，AsyncLocalStora

node v25.9.0 更新来了：测试运行器模块 Mock 大升级，AsyncLocalStorage、CLI、Crypto、REPL、Stream 等多项能力增强如果只从开发体验角度总结，Node.js v25.9.0 的变化可以归纳为几类：1. 测试能力更现代测试运行器模块 Mock 的统一设计，让模块模拟更自然，减少概念混乱，也更利于迁移。2. 异步上下文更强AsyncLocalStorage 增强后，对链路追踪、上下文传递、请求隔离等场景更友好。3. 启动和内存控制更方便CLI 新增的 --max-heap-size 对资源调优很实用。4. 加密与 WebCrypto 能力继续完善新增算法、API 调整、底层处理优化，说明 Crypto 相关能力仍在持续演进。5. REPL 和调试体验更灵活交互式开发体验进一步增强。6. 性能与稳定性持续优化Buffer、events、fs、stream、worker、zlib 等模块都能看到针对性能和安全的细节修复。

点赞评论收藏

04-20 07:11

北京动视元科技有限公司_产品中心_研发工程师

ComfyUI v0.19.3 更新详解：节点模板、SVG 模型、价格徽章与 Hunyuan3D 输

ComfyUI v0.19.3 更新详解：节点模板、SVG 模型、价格徽章与 Hunyuan3D 输出优化全面升级ComfyUI v0.19.3 是一次偏实用导向的版本更新。它没有追求大范围的架构变化，而是围绕真实使用过程中最容易遇到的问题进行了针对性处理：• LTX 模板控制更灵活• API 节点价格展示更准确• SVG 模型支持更完整• Hunyuan3D 输出更稳健• 工作流模板版本同步升级对于日常使用 ComfyUI 的用户而言，这些变化虽然看起来不算“夸张”，但实际上会明显改善使用体验，尤其是在 API 节点调用、生成结果兼容性以及工作流模板一致性方面。

点赞评论收藏

04-19 08:44

北京动视元科技有限公司_产品中心_研发工程师

rust 1.95.0 最新版发布：语言特性、编译器、平台支持、标准库、Rustdoc 与兼容性变更

点赞评论收藏

04-18 09:50

北京动视元科技有限公司_产品中心_研发工程师

ollama v0.21.0 最新更新：Hermes Agent 与 Ollama 联动、Copil

点赞评论收藏

04-17 06:37

北京动视元科技有限公司_产品中心_研发工程师

nginx 1.30.0稳定版深度解析：Early Hints、HTTP/2后端、MPTCP全量上线

nginx 1.30.0稳定版深度解析：Early Hints、HTTP/2后端、MPTCP全量上线，1.29.x分支精华全面整合核心新特性全解析：1.29.x分支精华功能全面落地（一）HTTP协议增强：Early Hints正式支持，前端加载性能革命性提升nginx 1.30.0稳定版正式实现HTTP Early Hints（103 Early Hints）功能，该特性作为HTTP/1.1与HTTP/2协议的重要扩展，允许服务器在处理主请求（如200 OK响应）前，提前向客户端推送关键资源的预加载提示（如CSS、JS、字体、图片等静态资源），彻底解决传统“请求-响应”串行模式下的资源加载阻塞问题，大幅缩短页面首屏渲染时间（TTFP）与用户可交互时间（TTI）。Early Hints核心价值：1. 并行加载优化：客户端收到103状态码后，无需等待主响应完成，即可立即发起关键资源请求，与服务器主请求处理并行执行，将资源加载从“串行”转为“并行”，复杂页面加载速度提升30%-80%；2. 全协议兼容：同时支持HTTP/1.1、HTTP/2与HTTP/3协议，覆盖所有现代浏览器与客户端，无需改造业务代码即可启用；3. 与gRPC、上游代理深度兼容：修复gRPC代理与Early Hints组合场景下的请求重新初始化问题，确保微服务架构下Early Hints稳定生效；4. HTTP/3编码优化：针对HTTP/3协议实现“103 Early Hints”索引字段行编码，降低协议传输开销，提升QUIC场景下Early Hints传输效率；5. 多响应处理修复：解决上游服务器返回多个103 Early Hints响应时的处理异常，确保复杂上游集群场景下提示信息准确传递。

点赞评论收藏

04-15 07:32

北京动视元科技有限公司_产品中心_研发工程师

ComfyUI v0.19.0 更新：大量新节点、新模型、新修复与性能优化全面落地，工作流与训练能力

ComfyUI v0.19.0 更新：大量新节点、新模型、新修复与性能优化全面落地，工作流与训练能力再升级核心功能更新：新模型、新能力、新节点不断加入1. LongCat-Image edit 支持本次更新中加入了 LongCat-Image edit。这一能力的加入，意味着图像编辑相关的使用场景得到了进一步扩展，用户可以在 ComfyUI 工作流中结合新能力进行图像处理与编辑。2. LTX2 支持参考音频（ID-LoRA）LTX2 新增了对 reference audio（ID-LoRA） 的支持。这项更新对音频相关流程非常关键，说明 LTX2 在参考音频驱动的能力上有了增强，能够更好地服务于带有音频条件的生成任务。3. 支持 Qwen3.5 文本生成模型本次版本加入了对 Qwen3.5 text generation models 的支持。这意味着文本生成工作流的模型选择进一步扩大，对文本理解、文本生成类应用有更好的兼容能力。与此同时，还修复了 Qwen 8B 与 TextGenerate 节点的兼容问题，使其可以正常工作。这类修复说明文本生成链路在本次版本中得到了较强的稳定性增强。4. 支持 RT-DETRv4 检测模型新增对 RT-DETRv4 detection model 的支持。这对于检测类任务很重要，能够帮助用户在目标检测相关工作流中使用更先进的检测模型能力。5. 支持 Ace Step 1.5 XL 模型新增对 Ace Step 1.5 XL model 的支持。这表示 ComfyUI 对相关模型生态的覆盖进一步扩展，用户可在现有流程中接入更多新模型。6. 新增小型 flux.2 decoder 支持本次版本还加入了对 small flux.2 decoder 的支持。这通常意味着生成或解码链路在资源占用和适配范围上可能更灵活。7. 实现 Ernie Image 模型新增了 Ernie Image model 的实现。这进一步丰富了图像模型的支持范围，让 ComfyUI 在多模型接入方面更加完整。8. 支持新的 Topaz 模型API 节点中新增了 Topaz model。这同样是模型生态扩展的一部分，表明 API 节点体系持续更新，覆盖更多外部模型。9. 新增 WAN2.7 相关节点API 节点中新增了 WAN2.7 的新节点。这说明 API 节点层面继续扩展，便于用户通过节点方式接入对应能力。10. 新增 SeeDance 2.0 节点合作节点部分加入了 SeeDance 2.0 nodes。这也是本次外部节点生态的更新之一，给工作流集成带来更多选择。

点赞评论收藏

04-16 07:29

北京动视元科技有限公司_产品中心_研发工程师

ollama v0.20.7 最新版更新详解：ROCm 7.2.1、Gemma4 渲染修复与多项 M

点赞评论收藏

04-14 08:11

北京动视元科技有限公司_产品中心_研发工程师

2026年4月TIOBE编程语言排行榜，Go语言排名第15，Rust语言排名16。Rust 增长势头

点赞评论收藏

04-13 07:58

北京动视元科技有限公司_产品中心_研发工程师

lmdeploy v0.12.3：视频输入、Qwen3.5、TurboMind 压缩张量、Ray 安

lmdeploy v0.12.3：视频输入、Qwen3.5、TurboMind 压缩张量、Ray 安全 API 等重大升级全面解析v0.12.3 版本概览本次版本更新的关键词非常明确：• 多模态能力增强• Qwen3.5 全面适配与优化• TurboMind 推理能力增强• Ray 与服务端安全性改进• RoPE / mRoPE 相关统一与修复• 缓存、端点、生成、图像视频处理等关键链路修复• CI、Docker、Python 代码现代化改造

点赞评论收藏

04-12 07:59

北京动视元科技有限公司_产品中心_研发工程师

nginx 1.29.8 发布：移除 CLOCK_MONOTONIC_FAST，修复子请求端口变量为

nginx 1.29.8 发布：移除 CLOCK_MONOTONIC_FAST，修复子请求端口变量为空核心功能新增与增强（一）新增max_headers指令，管控请求头数量nginx 1.29.8最具安全价值的更新是新增max_headers指令，该指令属于HTTP核心模块配置项，支持在http块与server块中配置，默认值为1000，用于限制客户端单次请求允许携带的请求头行数上限，从源头防范恶意请求发送大量请求头导致的服务资源耗尽、Slowloris类拒绝服务攻击。1. 指令定义与配置层级max_headers指令注册于ngx_http_core_module模块，配置层级为NGX_HTTP_MAIN_CONF|NGX_HTTP_SRV_CONF，支持单数字参数配置，在核心模块配置结构中新增max_headers字段，合并配置时默认赋值为1000，可根据业务场景灵活调大或缩小。2. 全协议栈生效机制该限制不仅作用于HTTP/1.1协议，同时同步适配HTTP/2与HTTP/3协议栈，在请求头解析流程中统一增加计数判断逻辑：• HTTP/1.1：在ngx_http_process_request_headers函数中对headers_in.count进行计数，超出上限直接返回431 Request Header Fields Too Large• HTTP/2：在ngx_http_v2_state_process_header函数中加入计数检查，触发上限直接关闭请求• HTTP/3：在ngx_http_v3_process_header函数中实现相同限制逻辑，保障三层协议安全一致性3. 安全防护价值在高并发公网环境中，恶意客户端可通过构造数百上千个请求头占用Nginx内存与CPU资源，max_headers提供了轻量级防护手段，无需依赖第三方WAF即可实现基础请求头限流，提升网关层抗攻击能力。

点赞评论收藏

04-10 08:24

北京动视元科技有限公司_产品中心_研发工程师

ollama v0.20.4 正式发布！MLX 性能大幅提升， Gemma4 闪光注意力全面启用

ollama v0.20.4 正式发布！MLX 性能大幅提升 ， Gemma4 闪光注意力全面启用本次v0.20.4版本发布时间为2026年4月9日，核心提交集中在4月7日与4月8日，整体变更可划分为六大核心板块：1. 底层推理加速优化：MLX框架M5性能提升、Gemma4闪光注意力启用与兼容修复2. 模型创建流程重构：实验性路径清理、Safetensors模型导入修复与逻辑简化3. 前端UI代码规范整改：未使用变量、常量声明、空捕获语句等语法问题修复4. 接口能力扩展：函数调用输出数组类型支持5. 硬件兼容强化：macOS Metal版本检测、旧GPU闪光注意力禁用、MLX库路径匹配优化6. 测试体系完善：新增图像生成集成测试、Safetensors解析单元测试、模型创建集成测试从代码改动规模来看，本次更新以新增功能与兼容修复为主，删除代码多为冗余逻辑与废弃路径，整体架构更加精简高效，同时大幅完善了测试覆盖，保障自定义模型、多模态模型、Safetensors格式模型的运行稳定性。

点赞评论收藏

04-11 07:13

北京动视元科技有限公司_产品中心_研发工程师

ollama v0.20.5 发布：OpenClaw全渠道打通、Gemma 4闪光注意力优化、模型保

ollama v0.20.5 发布：OpenClaw全渠道打通、Gemma 4闪光注意力优化、模型保存修复，本地AI部署再升级核心功能更新全解析：从生态打通到性能优化，每一处升级都直击痛点（一）OpenClaw渠道全面打通：一条命令连接全球主流通讯平台，本地AI实现全场景交互1. 功能核心：ollama launch openclaw 一键完成多渠道配置本次更新最重磅的功能，是OpenClaw渠道设置的原生集成。Ollama官方将OpenClaw——这款专注于本地AI与即时通讯工具对接的开源框架，深度融入Ollama核心命令体系，用户无需手动下载、配置、部署OpenClaw，仅需执行一条极简命令：ollama launch openclaw即可自动完成OpenClaw的启动、初始化、渠道配置全流程，直接连接WhatsApp、Telegram、Discord以及其他主流消息渠道。这一功能彻底解决了此前本地AI部署的一大痛点：本地模型交互场景单一，仅能通过本地终端或Web界面操作，无法融入用户日常使用的通讯生态，导致本地AI的实用性大打折扣。

点赞评论收藏

04-08 08:22

北京动视元科技有限公司_产品中心_研发工程师

ollama v0.20.3 深度解读：Gemma 4 工具调用修复、模型库大更新、OpenClaw

ollama v0.20.3 深度解读：Gemma 4 工具调用修复、模型库大更新、OpenClaw 兼容性问题彻底解决二、核心更新一：Gemma 4工具调用（Tool Calling）深度优化Gemma 4作为Google DeepMind推出的轻量高效开源模型系列，凭借31B/26B/E4B/E2B等多规格参数、优秀的推理速度与工具调用适配能力，成为ollama生态中热门选型。但在v0.20.3之前版本，Gemma 4在工具调用场景存在两个高频问题：额外闭合工具标签（extra closing tool tags）异常输出、工具调用格式解析失败，导致函数调用、API对接、结构化输出不稳定。2.1 修复一：抑制Gemma 4额外闭合工具标签问题背景：Gemma 4模型在生成工具调用响应时，会重复输出闭合标签（如、），造成解析器误判、格式断裂、工具调用中断。尤其在多轮工具调用、批量函数执行时，该问题会导致响应截断、JSON格式非法、应用程序报错。修复逻辑：在model/parsers/gemma4.go核心解析模块新增标签抑制机制：• 实时监控模型输出流，识别重复/多余的工具闭合标签• 动态过滤冗余标签，保留唯一有效闭合节点• 不影响正常工具调用格式，不修改原始语义内容• 兼容Gemma 4全规格（31b-cloud/31b/26b/e4b/e2b）技术影响：• 彻底解决Gemma 4工具调用格式错乱问题• 提升函数调用、API对接、Agent工作流稳定性• 减少开发者调试成本，无需在业务层做额外格式清洗

点赞评论收藏

04-09 06:41

北京动视元科技有限公司_产品中心_研发工程师

openclaw v2026.4.8发布，全面修复 Telegram、Slack、Bundled C

openclaw v2026.4.8发布，全面修复 Telegram、Slack、Bundled Channels、Agents、网络代理与运行时兼容问题从整体来看，openclaw v2026.4.8 的更新重点非常集中，主要解决了以下几类问题：1. 安装包运行稳定性提升Telegram 和多个 bundled channels/setup 不再依赖缺失的源码路径，安装后的 npm 构建启动更稳。2. 插件与版本兼容性修复bundled plugins 的兼容性元数据与发布版本对齐，确保 OpenClaw 2026.4.8 可正常加载相关组件。3. Agents 行为更一致update_plan 保持可用，/exec current-default 的展示也与真实运行时一致，减少理解偏差。4. Slack 在代理环境下更可用Socket Mode WebSocket 连接支持 HTTP(S) 代理和 NO_PROXY，actions 的文件下载 token 处理也更稳。5. 网络代理与沙箱访问更友好trusted env-proxy 模式下跳过 DNS pinning，让 proxy-only sandbox 的网络访问更合理。

点赞评论收藏

04-07 09:05

北京动视元科技有限公司_产品中心_研发工程师

DeepSpeed v0.18.9 正式发布！AutoTP 全面增强、ZeRO 与 SuperOff

DeepSpeed v0.18.9 正式发布！AutoTP 全面增强、ZeRO 与 SuperOffload 深度优化，大模型训练再升级DeepSpeed v0.18.9针对环境变量适配、GPU硬件检测逻辑进行了多项优化，解决了不同硬件平台、自定义环境路径下的适配问题，提升了框架的环境兼容性与部署灵活性。1. 支持$TRITON_HOME环境变量本次更新新增对环境变量的适配，框架会自动识别该环境变量配置的路径，解决了相关组件在自定义安装路径下无法被正确加载的问题。在过往版本中，仅默认读取系统默认路径下的相关文件，当用户通过自定义路径安装时，会出现路径查找失败、组件调用异常等问题，而通过适配TRITON_HOME环境变量，允许用户自由指定Triton的安装目录，大幅提升了框架在自定义部署环境下的适配能力，尤其适用于多版本Triton共存、离线部署等复杂场景。2. ROCm GPU架构检测移除不必要的shell=True针对AMD ROCm平台的GPU架构检测逻辑，本次更新移除了代码中不必要的shell=True参数。在Python的subprocess调用中，shell=True会带来潜在的安全风险与执行效率问题，同时可能引发命令解析异常。DeepSpeed v0.18.9优化了ROCm GPU架构检测的代码实现，采用无shell模式执行硬件检测命令，既提升了检测逻辑的安全性，又避免了因shell环境差异导致的GPU架构识别失败问题，保障了AMD GPU平台上DeepSpeed的稳定运行。3. 支持$DS_IGNORE_CUDA_DETECTION环境变量跳过本地GPU检测新增$DS_IGNORE_CUDA_DETECTION环境变量控制逻辑，当用户设置该环境变量时，DeepSpeed会跳过本地CUDA GPU的检测流程。该优化主要针对无GPU环境、远程训练节点、容器化部署等场景，在这些场景下，本地GPU检测不仅无意义，还可能因检测失败导致框架初始化异常。通过该环境变量，开发者可以灵活控制GPU检测行为，避免非必要的硬件检测流程，提升框架在纯CPU环境、云服务器远程调度场景下的初始化效率。4. 修复Triton自动调优缓存的NFS路径判断问题修复了Triton自动调优缓存模块中，is_nfs_path函数对不存在路径的处理异常问题。在过往版本中，当判断的NFS路径不存在时，该函数会抛出异常，导致Triton自动调优流程中断，影响模型训练的性能调优。v0.18.9优化了路径存在性校验逻辑，当目标路径不存在时，函数会返回合理的默认值，不会中断调优流程，保障了Triton自动调优功能在任意路径配置下的稳定运行，提升了大模型训练的性能调优可靠性。

点赞评论收藏

04-03 08:19

北京动视元科技有限公司_产品中心_研发工程师

openclaw v2026.4.1 发布！16 大核心功能升级 + 28 项关键修复，AI 智能体

openclaw v2026.4.1 发布！16 大核心功能升级 + 28 项关键修复，AI 智能体网关全面进化，稳定性与安全性再攀高峰核心功能新增（Changes）：16大特性，全面强化AI智能体核心能力（一）Tasks/chat：会话原生任务面板，后台任务管理更便捷本次更新率先为聊天模块新增**/tasks命令，打造会话原生的后台任务面板，实现当前会话内任务的可视化管理。该功能直接集成于聊天界面，无需切换外部工具，用户可实时查看会话关联的所有后台任务详情，包括任务执行状态、进度、耗时等核心信息；当会话无关联任务时，面板会自动显示最近任务记录与代理本地回退计数**，让用户清晰掌握智能体任务执行历史与异常回退情况，彻底解决此前版本中后台任务“不可见、难追踪”的痛点。这一优化将任务管理与聊天会话深度绑定，实现“对话-任务-反馈”的闭环体验，无论是临时执行的文件处理、数据查询，还是长期运行的自动化脚本、定时任务，用户都能通过简单命令实时掌控，大幅提升AI智能体任务执行的透明度与可控性。（二）Web search/SearXNG：集成SearXNG搜索插件，私有化搜索更安全针对用户对私有化、可配置网页搜索的需求，新版本正式加入SearXNG提供商插件，作为内置网页搜索能力的重要补充。SearXNG作为开源隐私搜索引擎，支持聚合多个搜索源结果且不追踪用户行为，此次集成后，用户可通过配置host参数自由指定SearXNG服务地址，既可以使用公共实例，也能部署私有实例，实现完全自主可控的网页搜索。相比此前依赖单一搜索源的模式，SearXNG集成带来三大优势：一是隐私保护升级，搜索请求不经过第三方商业平台，避免用户查询信息泄露；二是结果更全面，聚合多平台搜索结果，覆盖更广泛的信息源；三是部署更灵活，支持本地、内网、云端多种部署方式，适配个人、企业不同网络环境，完美契合OpenClaw本地优先的核心定位。

点赞评论收藏

04-06 08:17

北京动视元科技有限公司_产品中心_研发工程师

rust 1.94.1 最新更新：修复 wasm32-wasip1-threads 线程问题、回滚

Rust 1.94.1 已发布，这次更新虽然版本号看起来只是一个小版本修复，但实际包含了多个非常重要的改动，尤其涉及线程、Windows 文件系统扩展、Clippy、Cargo 依赖安全更新等内容。下面我们按照官方更新信息，逐条梳理本次 Rust 1.94.1 的核心变化。一、修复 std::thread::spawn 在 wasm32-wasip1-threads 上的问题Rust 1.94.1 修复了 std::thread::spawn 在 wasm32-wasip1-threads 目标上的问题。这意味着在该编译目标下，线程相关能力的行为得到了修正，对于使用 WebAssembly 线程能力的场景来说，这是一个重要的稳定性修复。如果你的项目编译目标包含 wasm32-wasip1-threads，这次更新值得尽快跟进，以避免线程创建相关异常。二、移除 std::os::windows::fs::OpenOptionsExt 新增方法本次更新还移除了此前添加到 std::os::windows::fs::OpenOptionsExt 的新方法。原因在于：这些新方法是 unstable 的，但 OpenOptionsExt 这个 trait 本身 不是 sealed，因此它不能被扩展加入非默认方法。也就是说，这次修改不是简单的删除某些功能，而是出于 trait 设计约束进行的调整。对于依赖 Windows 文件扩展能力的代码来说，需要注意这部分 API 变化。三、Clippy 修复 match_same_arms 的 ICERust 1.94.1 还修复了 Clippy 中 match_same_arms 的 ICE 问题。ICE 指的是内部编译器错误，这类问题通常会直接影响开发体验，甚至导致静态检查无法正常运行。这次修复说明 Clippy 在处理 match_same_arms 相关场景时的稳定性得到了改善，对依赖 Clippy 进行代码检查的开发者来说是一个实用修复。四、Cargo 更新 tar 到 0.4.45Cargo 方面，这次将 tar 更新到了 0.4.45。这次升级的原因很明确：它修复了 CVE-2026-33055 和 CVE-2026-33056。需要注意的是，官方说明中还特别指出：crates.io 的用户不受影响。同时，更多细节可以参考官方 blog 的说明。这部分更新主要涉及依赖安全性与工具链维护，对于使用 Cargo 的开发流程来说，这是一次重要的安全修复。五、Rust 1.94.1 本次更新重点总结这次 Rust 1.94.1 的更新内容可以概括为以下几个重点：• 修复 std::thread::spawn 在 wasm32-wasip1-threads 上的问题• 移除 std::os::windows::fs::OpenOptionsExt 中新增的 unstable 方法• 修复 Clippy 中 match_same_arms 的 ICE• Cargo 更新 tar 到 0.4.45• 修复 CVE-2026-33055 和 CVE-2026-33056• crates.io 用户不受影响

点赞评论收藏

04-04 08:56

北京动视元科技有限公司_产品中心_研发工程师

ollama v0.20.0 更新：Gemma 4 全家桶发布，音频、视觉、MoE、BPE 支持全面

ollama v0.20.0 更新：Gemma 4 全家桶发布，音频、视觉、MoE、BPE 支持全面升级整体来看，ollama v0.20.0 这次更新可以概括为几个核心方向：1. Gemma 4 正式上线• 提供了 E2B、E4B、26B、31B 多种规格• 支持 GGML 模型2. 音频能力全面增强• 支持音频输入• 新增转写命令• 增加 OpenAI 音频 API 与 transcription API 支持• 支持 input_audio• 简化音频输入方式3. Tokenizer 和模板能力增强• 增加 SentencePiece-style BPE 支持• pipeline 尊重 add_bos_token• renderer 重写并修复 BOS token 输出4. MoE 与推理路径优化• 增加 per_expert_scale• 修复 MoE 相关问题• 调整字段格式和分裂逻辑• 改进缓存复用5. 测试与工程能力增强• 视觉测试稳定性提升• 新增 thinking tests• 补充 Gemma 4 音频测试与 OpenAI API 覆盖

点赞评论收藏

04-05 09:33

北京动视元科技有限公司_产品中心_研发工程师

ollama v0.20.2 更新：默认首页从 launch 切换到 new chat，4 个文件同

ollama v0.20.2 更新：默认首页从 launch 切换到 new chat，4 个文件同步调整四、这次更新的整体意义从这 4 个文件的修改可以看出，这次版本更新并不是单点修改，而是数据库、后端、前端、路由跳转逻辑同步调整。统一后的结果就是：• 数据库存储默认值变为 chat• 数据迁移默认值变为 chat• 后端读取空值时默认变为 chat• 前端设置默认值变为 chat• 首页路由根据 chat 默认跳转到 new最终实现了一个一致的默认体验：应用首页默认进入 new chat，而不是 launch。五、变更总结本次 ollama v0.20.2 更新的核心可以概括为一句话：默认 app home view 从 launch 改为 chat，并且相关数据库、后端和前端默认值全部同步更新。涉及的关键文件有：• app/store/database.go• app/store/store.go• app/ui/app/src/hooks/useSettings.ts• app/ui/app/src/routes/index.tsx

点赞评论收藏

玩命加载中

福大大架构师每日一题

创作者周榜

热议话题