阿里淘天-AI算法&AI Agent优化工程师 【杭州】

300-600元/天
算法工程师
杭州
本科
5天/周
最少3个月
有转正
岗位关键词

投递时间:2026年4月28日-2026年6月30日

岗位职责
【AI 算法】 将大模型能力做成可上线、可迭代、可控成本的产品能力。通过打造数据飞轮、模型适配与后训练、评测与实验等关键手段,实现端到端的闭环交付,持续提升产品的效果与稳定性。 具体职责包括以下相关方向的一项或多项: 1.需求与问题定义 ● 深入业务与产品共创需求,将诉求转化为可执行的AI任务定义,明确目标、边界、优先级与验收口径。 2.方案与应用架构 ● 在Prompt、RAG、微调、Agent等路线间做技术选型与权衡,设计端到端应用架构(含上下文、工具调用、记忆、权限与安全),并完成RAG、Memory、Tool Use、多Agent等能力的工程化落地与生产级集成。 3.数据飞轮与治理 ● 搭建高效的数据采集、清洗与标注工程流水线。前瞻性地探索合成数据与模型自标注等自循环策略,同时建立完善的数据版本追踪与质量评估体系,真正打通“模型训练-业务应用-用户反馈-数据迭代”的增强回路。 4.模型适配与后训练 ● 主导基座大模型向顶尖垂直行业专家的后训练的全链路技术演进,包括高质量的SFT、RL阶段PPO、GRPO等前沿强化学习与偏好优化算法攻坚,全面突破模型在复杂业务场景下的指令遵循精度、极致可控性与长链路逻辑推理天花板,显著提升大模型在复杂业务场景下应用能力。 5.评测体系与实验 ● 面向业务目标设计评测指标与Rubric,搭建自动化评测框架(含人工评审),建立离线基准与线上实验体系(A/B、Bandit),持续监控指标漂移与策略投机以防止效果退化。 6.生产交付与运营 ● 负责系统集成与上线发布,对线上质量、稳定性与成本负责,建立监控、告警、兜底与人工接管机制,推动持续迭代。 【AI Agent优化工程师-】 这是一个综合的AI推理、优化的技术岗位,适合希望从事以下工作的候选人投递: ● 希望从事AI应用构建与模型优化工作的候选人 ● 希望从事AI应用数据构建与自动化评测工作的候选人 ● 希望从事多模态AI应用构建与算法优化工作的候选人 围绕真实业务核心场景,参与AI应用的系统化构建与优化,把AI变为业务增长引擎,具体职责包括以下相关方向的一项或多项: 1、AI应用全生命周期演进:深度参与业务问题建模、应用架构设计、上下文工程、训练数据构建、自动化评估体系、模型后训练优化等; 2、数据飞轮构建:打造高质量数据生产链路,探索合成数据(Synthetic Data)与高效蒸馏技术方案,跑通“业务-模型-反馈”迭代闭环; 3、评测体系构建:面向业务目标,设计完备的AI应用效果评估体系,构建自动化评估框架,建立离线评估与在线业务指标联动的量化评估能力; 4、强化学习与奖励机制设计:构建可工程化的Reward体系与RL训练环境,提升模型在垂直业务场景中的可控性与泛化能力; 5、AI外部能力体系搭建:实现AI应用所需的知识库(RAG)、长短期记忆系统(Memory)、工具调用、多Agent协作框架等 6、多模态AI应用开发:构建AI应用的多模态感知与推理能力,解决在UI自动化、视觉理解与审核、多模态会话等场景的落地应用问题。
岗位要求
【AI 算法】 1.基础条件 ● 计算机、数学、统计学等相关专业硕士/博士优先,优秀本科生不受限制。 ● 有顶会论文(ACL/EMNLP/ICLR/NeurIPS/ICML等)/高影响项目/开源贡献者加分。 2.专业能力 ● 模型与后训练:解Transformer/LLM模型架构、演进原理与局限;具备SFT/DPO/RL等后训练与迭代能力(含数据/评估/优化),对后训练算法有实践经验和深刻认知;拥有Agentic RL训练实操经验者优先。 ● Agent与系统编排:能做任务拆解与多Agent协作;熟悉RAG、Memory、Tool-Use(含MCP/类协议/Skills等)并能工程化落地;独立开发过具备一定影响力AI应用者优先。 ● 数据构建:具备Data-centric AI意识,精通后训练所需高质量数据挖掘与构造,具备合成数据(Synthetic Data)与动作轨迹(Trajectory)构建实践经验者优先。 ● 评测与交付:能搭建评估闭环(autorater/LLM-as-judge、离线评测、A/B);具备测试、调试、review、安全/隐私与质量门禁能力;能基于评测结果精准分析和定位问题,具备复杂多步任务的量化评估能力者优先。 ● 工程与系统素养:能够通过Vibe Coding快速构建项目原型;理解分布式系统/数据库/计算机系统基础;精通至少一门语言,熟练掌握Python与Pytorch;熟悉Git/命令行;了解大模型训练与推理框架(Megatron-LM、vLLM、DeepSpeed/FSDP等),有分布式训练/大规模数据处理经验(Hadoop/MaxCompute等)加分。 3.能力特质 ● 学习力:对AI有热情、对前沿技术与产品好奇,对未知开放,能举一反三。 ● 动手能力:积极主动体验市场中先进的模型和产品,独立阅读论文/技术报告等并快速复现,快速主动尝试落地先进开源项目,对主流AI开源项目有贡献者优先。 ● 技术审美:对新技术有近乎本能的渴望,能区分“能跑”与“优雅”,追求简洁、可维护、可扩展;在模型/框架/工具选型上保持高信噪比决策。 【AI Agent优化工程师-】 基础要求 1、专业要求:计算机、数学、统计学等相关专业硕士/博士优先,优秀本科生不受限制; 2、模型理解与优化:深入理解Transformer和主流LLM模型架构演进原理,对后训练算法有实操经验和深刻认知,拥有Agentic RL训练实操经验者优先; 3、AI应用构建能力:掌握主流AI协议(MCP、Skills等)、记忆系统(Memory)、知识库(RAG),独立开发过具备一定影响力AI应用者优先; 4、代码与工程能力:较强Python编程能力,熟练掌握Pytorch,了解大模型训练与推理框架(Megatron-LM、vLLM、DeepSpeed等),能高效处理分布式环境下的工程问题; 5、数据构建能力:有很强的Data-centric AI的意识,精通后训练所需高质量数据挖掘与构造,具备合成数据(Synthetic Data)与动作轨迹(Trajectory)构建实操经验者优先; 6、评测能力:拒绝盲目调参,能针对Agent任务设计科学的评测体系(LLM-as-a-Judge),能基于评测结果精准分析和定位问题,具备复杂多步任务的量化评估能力者优先。 7、对新技术有近乎本能的渴望,能够独立阅读论文/技术报告等并快速复现,快速主动尝试落地先进开源项目,对主流AI开源项目有贡献者优先。 加分项: 1、在AI顶会(ACL/EMNLP/ICLR/NeurIPS/ICML等)发表大模型评测、数据合成、Agent、RL相关一作或共一论文; 2、知名大模型评测框架或高质量开源数据核心贡献者; 3、极强的数学功底和逻辑分析能力,对高质量数据和评测有端到端闭环经验。
浙江省杭州市余杭区阿里巴巴西溪园区A区
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报
阿里巴巴集团
电商
不需要融资
杭州市
查看其他 418 个职位