AI Agent优化工程师(训练、数据、评测方向)(2027毕业生)
10-1000元/天
后端工程师 杭州 本科 5天/周 最少3个月 有转正

岗位关键词
岗位职责
围绕真实电商核心场景,参与AI应用的系统化构建与优化,把AI变为业务增长引擎,具体工作包括:
● AI应用全生命周期演进:深度参与业务问题建模、应用架构设计、上下文工程、训练数据构建、自动化评估体系、模型后训练优化等;
● 数据飞轮构建:打造高质量数据生产链路,探索合成数据(Synthetic Data)与高效蒸馏技术方案,跑通“业务-模型-反馈”迭代闭环;
● 评测体系构建:面向业务目标,设计完备的AI应用效果评估体系,构建自动化评估框架,建立离线评估与在线业务指标联动的量化评估能力;
● 强化学习与奖励机制设计:构建可工程化的Reward体系与RL训练环境,提升模型在垂直业务场景中的可控性与泛化能力;
● AI外部能力体系搭建:实现AI应用所需的知识库(RAG)、长短期记忆系统(Memory)、工具调用、多Agent协作框架等;
● 多模态AI应用开发:构建AI应用的多模态感知与推理能力,解决在UI自动化、视觉理解与审核、多模态会话等场景的落地应用问题。
岗位要求
● 专业要求:2027年应届毕业生,计算机、数学、统计学等相关专业硕士/博士优先,优秀本科生不受限制;
● 模型理解与优化:深入理解Transformer和主流LLM模型架构演进原理,对后训练算法有实操经验和深刻认知,拥有Agentic RL训练实操经验者优先;
● AI应用构建能力:掌握主流AI协议(MCP、Skills等)、记忆系统(Memory)、知识库(RAG),独立开发过具备一定影响力AI应用者优先;
● 代码与工程能力:较强Python编程能力,熟练掌握Pytorch,了解大模型训练与推理框架(Megatron-LM、vLLM、DeepSpeed等),能高效处理分布式环境下的工程问题;
● 数据构建能力:有很强的Data-centric AI的意识,精通后训练所需高质量数据挖掘与构造,具备合成数据(Synthetic Data)与动作轨迹(Trajectory)构建实操经验者优先;
● 评测能力:拒绝盲目调参,能针对Agent任务设计科学的评测体系(LLM-as-a-Judge),能基于评测结果精准分析和定位问题,具备复杂多步任务的量化评估能力者优先。
加分项
● 在AI顶会(ACL/EMNLP/ICLR/NeurIPS/ICML等)发表大模型评测、数据合成、Agent、RL相关一作或共一论文;
● 知名大模型评测框架或高质量开源数据核心贡献者;
● 极强的数学功底和逻辑分析能力,对高质量数据和评测有端到端闭环经验。
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请
立即举报