avatar-decorate
获赞
5199
粉丝
216
关注
231
看过 TA
712
西昌学院
2011
golang
IP属地:北京
微信公众号:福大大架构师每日一题
私信
关注
ollama v0.13.1 发布:全新 Ministral-3 与 Mistral-Large-3 模型,增强工具调用与GPU兼容性Ollama 2025年12月3日发布了 v0.13.1 版本更新,本次更新重点引入了两个新的模型家族,并带来了多项功能增强、错误修复及底层改进,进一步提升了模型的部署灵活性与运行稳定性。一、 全新模型登场1. Ministral-3 系列:此系列模型专为边缘部署设计,能够在广泛的硬件设备上高效运行,为资源受限的环境提供了强大的本地AI能力。2. Mistral-Large-3 系列:这是一个通用的多模态混合专家(MoE)模型,旨在处理生产级任务和企业级工作负载,在复杂场景下表现出色。二、 核心功能与改进1. 引擎与工具调用:• nomic-embed-text 模型现在默认使用 Ollama 自身的引擎运行。• 为 cogito-v2.1 模型新增了工具调用(tool calling)支持。• 同样为 cogito-v2.1 模型添加了思维链(thinking)解析功能。2. GPU 与系统兼容性修复:• 修复了 CUDA VRAM 发现的相关问题。• 解决了在仅配备 CPU 的系统上,模型可能被错误驱逐(evict)的问题。• 修复了在某些旧款 GPU 上无法检测到 CUDA 的问题。• 改进了对 CUDA 计算能力(CC)与目标库版本的兼容性验证。• (Windows系统)增加了对 PATH 中潜在不兼容库文件(如 ggml-base.dll)的检测与警告。3. 错误处理与用户体验:• Ollama 现在能够更好地呈现和渲染错误信息,而非简单地显示 “Unmarshal: errors”。• API 客户端 (api/client) 增强了对非 JSON 格式流式错误响应的处理能力。4. 应用与文档:• 修复了应用内连接打开逻辑,优化了用户体验。• 更新了应用内帮助链接,使其指向官方文档网站。• 清理了文档中已弃用参数(如 mirostat, mirostat_eta, mirostat_tau)的说明。三、 重要代码变更摘要本次更新包含了 18个提交,涉及 33个文件 的更改,由 12位贡献者 共同完成。部分关键变更包括:• API/客户端:增强了错误处理逻辑,当服务器返回非JSON格式的错误响应(如纯文本或HTML)时,能正确传递状态码和错误信息。• 应用层:优化了 macOS 和 Windows 系统上处理自定义 URL 协议(如 ollama://)的逻辑。• 模型支持:• ministral-3:模型支持现已集成,并添加了相应的测试。• deepseek2:升级以支持运行 v3+ 版本的模型。• 模型解析器:新增了针对 cogito-v2.1 模型的专用解析器,以支持其独特的工具调用和思维格式。• mistral3 模型结构:在转换逻辑中增加了对 LLAMA 4 缩放因子等新 rope 参数的支持。• 底层与发现:• GPU 发现:改进了设备发现机制,避免库路径重叠,并加入了对 NVIDIA Jetson Jetpack 版本的更精确匹配要求。• KV 缓存:测试现在同时覆盖使用和不使用 PermutedV 的情况。• LLM 服务器:修正了在仅有 CPU 的系统上进行模型布局验证的逻辑,防止不必要的模型驱逐。四、 其他调整• 将 Vulkan 着色器文件标记为“已供应”文件。• 更新了 .gitattributes 以正确归类相关文件。• 移除了代码检查工具中的 gocritic 规则。总结Ollama v0.13.1 版本是一个以模型扩展和系统稳固性为主的更新。它不仅为用户带来了适用于边缘和企业场景的新模型选择,还通过一系列关键的缺陷修复和兼容性改进,显著提升了软件在各类硬件环境下的可靠性和用户体验。特别是对 cogito 和 ministral 系列模型支持的增强,展现了 Ollama 生态持续扩展对多样化模型架构的兼容能力。
0 点赞 评论 收藏
分享
DeepSeek-V3.2系列正式发布:开源模型首次达到GPT-5水平,斩获四项国际竞赛金牌继上周推出数学推理模型 DeepSeekMath-V2 之后,DeepSeek 再度更新,正式发布 V3.2 系列模型。这次一次带来两个版本,分别面向不同应用场景:日常使用与高难度推理。01 双模型定位与核心差异DeepSeek本次发布的V3.2系列包含两个定位分明的模型,以满足不同场景的需求 。DeepSeek-V3.2(标准版) 定位于日常使用场景,注重平衡推理能力与输出效率。该版本已全面部署于DeepSeek官方网页端、App和API服务 。在多项公开推理基准测试中,其表现接近GPT-5,仅略低于Gemini-3.0-Pro 。DeepSeek-V3.2-Speciale(研究版) 则专注于推动开源模型的极限推理能力边界。该模型是V3.2的长思考增强版,结合了DeepSeek-Math-V2的定理证明能力,在高度复杂任务上表现卓越 。02 卓越的性能表现DeepSeek-V3.2-Speciale在多项国际顶级竞赛中展现出惊人实力,成功斩获IMO2025(国际数学奥林匹克)、CMO2025(中国数学奥林匹克)、ICPCWorldFinals2025(国际大学生程序设计竞赛全球总决赛)及IOI2025(国际信息学奥林匹克)金牌 。其中,ICPC与IOI成绩分别达到了人类选手第二名与第十名的水平 。在主流推理基准测试上,Speciale模型的性能表现媲美Gemini-3.0-Pro,展现出强大的推理能力 。不过需要注意的是,该版本因推理链较长、Token消耗高,目前仅限研究使用 。
0 点赞 评论 收藏
分享
0 点赞 评论 收藏
分享
agno v2.3.3 发布:引入上下文压缩与内存优化,增强文件搜索和异步支持2025 年 11 月 27 日,agno 发布了 v2.3.3 版本,本次更新带来了多项新功能、性能改进以及 Bug 修复,尤其是在上下文管理、内存优化、文件搜索和异步支持方面有了显著增强。以下为详细更新内容。一、新功能(New Feature)1. 上下文压缩(Context Compression)• 新增运行时压缩工具调用结果的功能,有助于在智能体运行过程中对上下文进行管理。• 该功能可以帮助智能体保持在上下文窗口范围内,避免触发速率限制或响应质量下降。• 功能为 Beta 版,可参考官方文档获取更多信息。2. 内存优化(Memory Optimisation)• 新增总结用户记忆的能力,允许在智能体运行之外进行记忆摘要。• 在 MemoryManager 中新增 optimize_memories 和 aoptimize_memories 方法。• 当前仅支持一种策略,未来会扩展更多。• 功能为 Beta 版。3. Gemini 文件搜索支持(Gemini File Search Support)• 引入了对 Google Gemini File Search 的支持。4. 文件搜索存储管理(File Search Store Management)• 可创建、列出、获取和删除文档存储。5. 文件上传与导入(File Upload & Import)• 支持直接上传文件,可自定义分块配置及元数据。6. 文档管理(Document Management)• 支持基于元数据过滤列出、获取、删除和更新文档。7. 引用提取(Citation Extraction)• 提供辅助方法,从响应中提取并格式化引用来源。8. 异步支持(Async Support)• 全面支持 async/await 以满足生产环境负载需求。9. 示例 Cookbooks(暂未发布完整文档)• 基础文件搜索示例:cookbook/models/google/gemini/file_search_basic.py• 高级文件搜索示例:cookbook/models/google/gemini/file_search_advanced.py• RAG 文件搜索流水线示例:cookbook/models/google/gemini/file_search_rag_pipeline.py二、功能改进(Improvements)1. 运行时输出模式定义(output_schema on run/arun)• 可在 run() 和 arun() 方法(包括 Agent、Team 以及 AgentOS API)中动态覆盖 output_schema。2. AWS Bedrock API Key 支持• 新增对 AWS Bedrock API 密钥的支持。3. AWS Claude 兼容性增强• 增加对思考模型与缓存功能的支持。4. VertexAI Claude 兼容性增强• 增加对思考模型与缓存的支持。5. Gemini 3 思考等级(thinking_level)支持• 可为 Gemini 设置 thinking_level 参数。三、Bug 修复(Bug Fixes)1. 异步知识检索• 修复因缺少异步版本的 get_user_message,导致异步知识检索失败的问题。2. 团队成员事件流• 即使配置 stream_member_events=True 且 stream_events=False,仍确保成员事件能正确流式传输。3. 迁移管理器(MigrationManager)改进• 修复无法对 2.3.0 以下版本进行迁移的问题。• 新增强制迁移标志(force migration flag)。4. StopAgentRun 异常处理• 修复 StopAgentRun 无法正确终止智能体运行的问题。5. PDF 图像读取器• 修复生成 ID 基于文件名而不是 UUID 的问题。6. MCP 工具名前缀(tool_name_prefix)• 将默认值改为 None,避免默认添加“_”前缀。7. AGUI 界面修复• 修复工具调用 ID 出现重复值的问题。• 修复工具调用缺少助手消息的问题。四、本次版本主要变更总结(What's Changed)• 修正文档链接失效问题。• 修复异步知识检索逻辑。• 改进团队类的 JSON 输出逻辑。• 新增运行时可配置输出模式功能。• StopAgentRun 与 RetryAgentRun 正式实现。• 增加对 MongoDB 异步 SDK 的支持。• 引入记忆优化与工具调用压缩功能。• 优化 AWS Claude 兼容性及 API 密钥支持。• 增加 Gemini 文件搜索支持。• 修复测试用例中异步知识访问的稳定性问题。五、总结agno v2.3.3 版本是一次 功能与性能的双重提升 更新,尤其在 上下文压缩、内存优化、文件搜索能力 方面有重大改进,同时增强了 AWS Claude、VertexAI Claude 的兼容性,并全面支持 异步任务。
0 点赞 评论 收藏
分享
dify 1.10.1 多数据库时代开启:新增 MySQL 支持与性能全面优化2025年11月26日,Dify 正式发布 1.10.1 版本,这次更新不仅带来了重大功能增强和稳定性修复,更标志着 Dify 进入了 多数据库新时代 —— MySQL 支持终于到来,并与 PostgreSQL、OceanBase 一起形成完整的多数据库体系。🚀 新功能亮点1. 基础设施与 DevOps 升级• MySQL 适配完成:现在 PostgreSQL / MySQL / OceanBase 均已全面支持。• 新增 DB_TYPE 配置选项,用于选择数据库类型。• 支持 MySQL 特有的 JSON / LONGTEXT / UUID / 索引差异。• Alembic 迁移脚本更新,适配多数据库兼容性。• 引入跨数据库 SQL 辅助方法,优化统计与日期处理。• 数据集元数据过滤重写,使用 SQLAlchemy JSON 操作符。• 新增 MySQL 迁移测试 CI 工作流。这一改动是 Dify 后端架构的重要里程碑,多数据库支持首次成为一等公民。2. 性能与工作流编辑器优化• 工作流编辑器性能显著提升:去除了高成本的逐节点验证,减少不必要渲染,性能从 50 节点变卡到接近 200 节点仍保持流畅。3. 工作流引擎与界面优化• 改进了工作流编辑器 UI、稳定性、交互体验,包括变量检查、媒体组件、节点交互优化。🛠 修复与改进运行时与工作流执行稳定性• 修复高级聊天工作流无法正确停止的问题,避免进程被卡住。• 修复草稿模式下运行任意节点会触发 500 错误的情况,提升调试稳定性。• 修正循环/迭代评估时的令牌统计错误(不涉及计费)。• 修复工作流作为工具返回空文件字段的问题。• 解决 FileService 会话作用域导致文件删除异常的问题。知识库• 修复使用 weightedScore 检索选项时触发 500 错误的问题,恢复加权排名稳定性。开发体验与 SDK• 修复 Node.js SDK 路由与 multipart 上传的处理问题,保证文件与数据提交稳定性。• 修复 OpenAPI/Swagger 加载失败的问题,恢复开发文档访问。Web UI 与用户体验• 修复暗色模式下 ExternalDataToolModal 渲染不一致的问题。• 优化 Marketplace 搜索触发与滚动行为。• 修复查看 chatflow 日志详情时导航不正确的问题。• 修复 README 显示面板的排版与渲染问题。• 减少 useNodes hook 的多余渲染,提升前端性能。插件与集成• 更新插件验证逻辑,改为使用唯一标识符,保证安装与更新的正确性。系统健壮性• 防止 TriggerProviderIdentity 中出现可空标签,避免运行时错误。• 优化无效 webhook 请求的错误提示,更清晰定位问题。反馈与日志• 修复点赞/点踩反馈在日志中不显示的问题。国际化 (i18n)• 统一触发与计费事件的术语。• 修复执行相关翻译缺失或错误的问题。• 删除错误的“running”翻译条目。• 重构 i18n 脚本并移除过期翻译键。• 增补缺失翻译,提升多语言覆盖率。维护与开发工具链• 新增前端自动化测试规则。• 升级系统库与 Python 依赖,保持安全性与兼容性。• 更新启动脚本使用 pnpm dev,简化贡献者开发流程。
0 点赞 评论 收藏
分享
langgraph 1.0.4 最新发布:功能优化与修复详解2025年11月26日,langgraph 正式发布 1.0.4 版本,这是继 1.0.3 之后又一次重要的功能优化与问题修复版本。本次更新围绕稳定性、代码结构优化以及依赖清理进行了多项改进,同时发布了相关预构建版本。以下是详细更新内容:1. 功能与版本发布• langgraph 1.0.4 正式发布该版本延续了此前的功能特性,并在流处理、远程图配置等方面进行了微调与优化。• langgraph-prebuilt 1.0.5 发布针对预构建版本进行了更新,确保用户在无需手动构建的情况下也能获得最新功能与修复。• prebuilt 1.0.3 发布同步更新预构建依赖版本,修复了部分警告信息。2. 功能优化与结构调整• 移除远程图可配置字段中的线程 ID针对远程图的可配置字段做了清理,去除了线程 ID,以简化配置逻辑并减少潜在冲突。• 分离 prepare_push_* 系列函数对相关准备推送的函数进行重构和拆分,提升代码可维护性与模块化程度。• 清理部分引用删除了代码中不再使用的引用,保持代码整洁与可读性。3. SDK 与类型检查增强• Python SDK 增强类型检查增补了更多的类型检查规则,提升开发过程中类型推断的准确性,从而减少运行时错误。4. 问题修复• 修复流模式值中断问题修复了在流模式下可能发生的值中断问题,提升流处理的稳定性。• 预构建版本依赖警告修复修正了预构建版本中出现的依赖警告信息,保证构建输出的干净与稳定。总结本次 langgraph 1.0.4 更新主要集中在:• 性能优化:对远程图配置、预构建依赖进行了清理。• 代码结构升级:函数模块化、引用清理。• 稳定性提升:修复了流模式与依赖警告相关问题。• 开发体验改进:增强 Python SDK 的类型检查能力。
0 点赞 评论 收藏
分享
mediamtx v1.15.4 San Francisco 发布更新详解mediamtx 在 2025年11月21日发布了 v1.15.4 版本(代号 “San Francisco”),本次更新包含了多项修复与性能优化,涵盖了通用功能、RTP、RTSP、HLS,以及依赖库的升级,同时,还引入了安全构建机制,确保发布的二进制文件可信。以下为更新详情:一、通用功能更新• 支持多个 CORS 允许来源,提升跨域访问的灵活配置能力。• 新增 udpReadBufferSize 参数,可设置全局 UDP 读取缓冲区大小,应用于所有 UDP 套接字。• udpReadBufferSize 扩展到 WebRTC UDP 套接字,能够在不修改系统参数的情况下减少数据包丢失。• 修复录制功能中 FMP4 文件持续时间溢出的问题。两个采样之间的时间戳差值原本使用无符号整数存储,当为负数时会造成溢出。二、RTP相关更新• 在数据读取前先对 RTP 包进行重新排序,提升数据处理的连贯性和稳定性。三、RTSP相关更新• 支持没有状态消息的 RTSP 响应。• 修复在使用 Media Foundation 读取时的超时问题。• 修复 MIKEY 消息的 SP 负载,正确填充 PayloadSPPolicyParamTypeAuthTagLen 和 PayloadSPPolicyParamTypeSessionAuthKeyLen。• 支持动态 SSRC 的格式。• 优化性能,在解码时仅处理一次 RTP 头部。四、HLS相关更新• HLS 复用器中修复 FMP4 文件持续时间溢出的问题,避免播放时出现异常时间戳。
0 点赞 评论 收藏
分享
ragflow v0.22.1 发布:支持Word/Markdown导出、S3数据源接入、Flask升级为异步框架等重大改进一、主要改进1. Agent功能增强• 支持将 Agent 输出内容导出为 Word 或 Markdown 格式,方便用户进行后续文档处理与分享。• 新增 列表操作组件(List operations),实现对列表数据的处理功能。• 新增 变量聚合组件(Variable aggregator),用于聚合不同数据来源的变量值。2. 数据源拓展• 支持 S3 兼容的数据源,包括 MinIO 等对象存储系统。• 新增 JIRA 数据同步功能,实现与项目管理平台的数据联动。3. 界面与交互优化• 持续优化 Profile 页面布局,提升用户体验与交互流畅度。4. 服务架构升级• 将 Flask 框架从同步版本升级为 异步版本(Quart),显著提升并发能力,减少调用上游大模型服务时的阻塞问题。二、修复的主要问题• 解决 v0.22.0 中的 BUG:用户在包含已解析文件的数据集中,切换内置模型时无法正确解析或处理文件的问题。• 解决 Word 文档中图片拼接的显示问题。• 修复聊天记录中混合图片与文字未正确显示的问题。• 修复无法选择用户中心时区的问题。• 修复变量分配器连接其他运算符时的兼容性问题。• 修复在 API /api/v1/dify/retrieval 中查询无结果的问题。• 修复矿物解析(mineru_parser)属性获取逻辑错误。• 修复多次添加会话变量时被覆盖的问题。• 修复列表操作组件不支持对象数组排序的问题。• 修复 check_embedding 随机采样范围不合理的问题。• 修复圈状导入(circle imports)问题。• 修复结构化数据在某些操作中丢失的问题。三、新增支持的模型• Gemini 3 Pro Preview• 新增大模型服务提供商 Jiekou.AI四、其他功能优化与新增• 为 Agent 消息回复功能新增文件下载能力。• 新增动态变量赋值表单,提高变量管理的可视化体验。• 新增变量显示功能,在变量赋值节点中可直接查看当前变量值。• 为 RAPTOR 增加容错机制。• 为数据操作类组件增加结构化输出显示开关。• 新增删除查询变量时的用户警告提示。• 确保结构化数据仍存储于输出中,以兼容旧版本。• 允许 Begin 操作符的键值仅包含字母、数字与下划线。五、总结本次 ragflow v0.22.1 更新不仅在 Agent 功能、数据源类型、性能架构方面进行了大幅提升,还修复了多项影响使用体验的重要问题。同时,对多语言支持、结构化数据兼容性和可视化交互进行了细致优化,为构建高效、稳定的 RAG 工作流提供了坚实基础。
0 点赞 评论 收藏
分享
RustDesk 1.4.4 发布:多平台增强兼容性与功能优化1. Wayland 多缩放显示器更佳支持针对 Gnome 和 KDE 环境,提升了在多缩放显示器下的兼容性,改善了图像显示效果。2. 边缘滚动新增边缘滚动功能,优化了鼠标在远程桌面上的操作体验。3. 连接结束时的备注功能在远程连接结束时可直接添加备注,方便记录连接信息和交互情况。4. iOS 文件传输管理支持传输到 iOS 设备的文件可通过 文件 应用和 iTunes 进行管理,提升了移动端文件处理能力。5. 移动端文件传输排序反转移动端文件传输界面可翻转列表排序,便于快速定位目标文件。6. 文件传输自动重连启动在连接自动重连后,文件传输功能会自动启动,不需重复操作。7. iOS 代理设置展示iOS 上可以直接查看代理相关设置,提高网络环境的透明度。8. 加载自定义 CA 根证书(移动端)支持在移动端加载自定义安装的 CA 根证书,提升 TLS 连接灵活性。9. Sciter 版本 UI 定制化Sciter 架构版本加入 UI 定制功能,方便个性化界面调整。10. 不安全 TLS 选项新增允许使用不安全 TLS 的选项,方便在特殊调试环境下连接。11. macOS 从 dmg 文件命令行更新支持通过命令行方式直接从 dmg 文件进行更新,提高运维效率。
0 点赞 评论 收藏
分享

创作者周榜

更多
关注他的用户也关注了:
牛客网
牛客网在线编程
牛客网题解
牛客企业服务