阿里淘天-AI算法&AI Agent优化工程师【杭州】

300-600元/天

算法工程师

本科

5天/周

最少3个月

有转正

张先生昨日在线

阿里巴巴集团·后端开发

反馈率：100% | 反馈时长：1天

岗位关键词

投递时间：2026年4月28日-2026年6月30日

岗位职责

【AI 算法】将大模型能力做成可上线、可迭代、可控成本的产品能力。通过打造数据飞轮、模型适配与后训练、评测与实验等关键手段，实现端到端的闭环交付，持续提升产品的效果与稳定性。具体职责包括以下相关方向的一项或多项： 1.需求与问题定义 ● 深入业务与产品共创需求，将诉求转化为可执行的AI任务定义，明确目标、边界、优先级与验收口径。 2.方案与应用架构 ● 在Prompt、RAG、微调、Agent等路线间做技术选型与权衡，设计端到端应用架构（含上下文、工具调用、记忆、权限与安全），并完成RAG、Memory、Tool Use、多Agent等能力的工程化落地与生产级集成。 3.数据飞轮与治理 ● 搭建高效的数据采集、清洗与标注工程流水线。前瞻性地探索合成数据与模型自标注等自循环策略，同时建立完善的数据版本追踪与质量评估体系，真正打通“模型训练-业务应用-用户反馈-数据迭代”的增强回路。 4.模型适配与后训练 ● 主导基座大模型向顶尖垂直行业专家的后训练的全链路技术演进，包括高质量的SFT、RL阶段PPO、GRPO等前沿强化学习与偏好优化算法攻坚，全面突破模型在复杂业务场景下的指令遵循精度、极致可控性与长链路逻辑推理天花板，显著提升大模型在复杂业务场景下应用能力。 5.评测体系与实验 ● 面向业务目标设计评测指标与Rubric，搭建自动化评测框架（含人工评审），建立离线基准与线上实验体系（A/B、Bandit），持续监控指标漂移与策略投机以防止效果退化。 6.生产交付与运营 ● 负责系统集成与上线发布，对线上质量、稳定性与成本负责，建立监控、告警、兜底与人工接管机制，推动持续迭代。【AI Agent优化工程师-】这是一个综合的AI推理、优化的技术岗位，适合希望从事以下工作的候选人投递： ● 希望从事AI应用构建与模型优化工作的候选人 ● 希望从事AI应用数据构建与自动化评测工作的候选人 ● 希望从事多模态AI应用构建与算法优化工作的候选人围绕真实业务核心场景，参与AI应用的系统化构建与优化，把AI变为业务增长引擎，具体职责包括以下相关方向的一项或多项： 1、AI应用全生命周期演进：深度参与业务问题建模、应用架构设计、上下文工程、训练数据构建、自动化评估体系、模型后训练优化等； 2、数据飞轮构建：打造高质量数据生产链路，探索合成数据（Synthetic Data）与高效蒸馏技术方案，跑通“业务-模型-反馈”迭代闭环； 3、评测体系构建：面向业务目标，设计完备的AI应用效果评估体系，构建自动化评估框架，建立离线评估与在线业务指标联动的量化评估能力； 4、强化学习与奖励机制设计：构建可工程化的Reward体系与RL训练环境，提升模型在垂直业务场景中的可控性与泛化能力； 5、AI外部能力体系搭建：实现AI应用所需的知识库（RAG）、长短期记忆系统（Memory）、工具调用、多Agent协作框架等 6、多模态AI应用开发：构建AI应用的多模态感知与推理能力，解决在UI自动化、视觉理解与审核、多模态会话等场景的落地应用问题。

岗位要求

【AI 算法】 1.基础条件 ● 计算机、数学、统计学等相关专业硕士/博士优先，优秀本科生不受限制。 ● 有顶会论文（ACL/EMNLP/ICLR/NeurIPS/ICML等）/高影响项目/开源贡献者加分。 2.专业能力 ● 模型与后训练：解Transformer/LLM模型架构、演进原理与局限；具备SFT/DPO/RL等后训练与迭代能力（含数据/评估/优化），对后训练算法有实践经验和深刻认知；拥有Agentic RL训练实操经验者优先。 ● Agent与系统编排：能做任务拆解与多Agent协作；熟悉RAG、Memory、Tool-Use（含MCP/类协议/Skills等）并能工程化落地；独立开发过具备一定影响力AI应用者优先。 ● 数据构建：具备Data-centric AI意识，精通后训练所需高质量数据挖掘与构造，具备合成数据（Synthetic Data）与动作轨迹（Trajectory）构建实践经验者优先。 ● 评测与交付：能搭建评估闭环（autorater/LLM-as-judge、离线评测、A/B）；具备测试、调试、review、安全/隐私与质量门禁能力；能基于评测结果精准分析和定位问题，具备复杂多步任务的量化评估能力者优先。 ● 工程与系统素养：能够通过Vibe Coding快速构建项目原型；理解分布式系统/数据库/计算机系统基础；精通至少一门语言，熟练掌握Python与Pytorch；熟悉Git/命令行；了解大模型训练与推理框架（Megatron-LM、vLLM、DeepSpeed/FSDP等），有分布式训练/大规模数据处理经验（Hadoop/MaxCompute等）加分。 3.能力特质 ● 学习力：对AI有热情、对前沿技术与产品好奇，对未知开放，能举一反三。 ● 动手能力：积极主动体验市场中先进的模型和产品，独立阅读论文/技术报告等并快速复现，快速主动尝试落地先进开源项目，对主流AI开源项目有贡献者优先。 ● 技术审美：对新技术有近乎本能的渴望，能区分“能跑”与“优雅”，追求简洁、可维护、可扩展；在模型/框架/工具选型上保持高信噪比决策。【AI Agent优化工程师-】基础要求 1、专业要求：计算机、数学、统计学等相关专业硕士/博士优先，优秀本科生不受限制； 2、模型理解与优化：深入理解Transformer和主流LLM模型架构演进原理，对后训练算法有实操经验和深刻认知，拥有Agentic RL训练实操经验者优先； 3、AI应用构建能力：掌握主流AI协议（MCP、Skills等）、记忆系统（Memory）、知识库（RAG），独立开发过具备一定影响力AI应用者优先； 4、代码与工程能力：较强Python编程能力，熟练掌握Pytorch，了解大模型训练与推理框架（Megatron-LM、vLLM、DeepSpeed等），能高效处理分布式环境下的工程问题； 5、数据构建能力：有很强的Data-centric AI的意识，精通后训练所需高质量数据挖掘与构造，具备合成数据（Synthetic Data）与动作轨迹（Trajectory）构建实操经验者优先； 6、评测能力：拒绝盲目调参，能针对Agent任务设计科学的评测体系（LLM-as-a-Judge），能基于评测结果精准分析和定位问题，具备复杂多步任务的量化评估能力者优先。 7、对新技术有近乎本能的渴望，能够独立阅读论文/技术报告等并快速复现，快速主动尝试落地先进开源项目，对主流AI开源项目有贡献者优先。加分项： 1、在AI顶会（ACL/EMNLP/ICLR/NeurIPS/ICML等）发表大模型评测、数据合成、Agent、RL相关一作或共一论文； 2、知名大模型评测框架或高质量开源数据核心贡献者； 3、极强的数学功底和逻辑分析能力，对高质量数据和评测有端到端闭环经验。

浙江省杭州市余杭区阿里巴巴西溪园区A区

牛客安全提示：如发现虚假招聘、广告，或以任何名义索要证件、费用，或诱导异地入职、参与培训等均属违法行为，发现请立即举报

阿里巴巴集团

电商

不需要融资

杭州市

查看其他 418 个职位

0 笔试题目 4473 面试经验 2538 面试短评

阿里淘天-AI算法&AI Agent优化工程师 【杭州】

阿里淘天-AI算法&AI Agent优化工程师【杭州】