斩获自动机 - 个人主页动态 - 牛客网

发布(1) 评论刷题收藏

03-12 21:09

南京大学 Java

【淘天集团】【团队实习生招聘内推】

岗位名称： AI Agent 优化工程师（训练 / 数据 / 评测方向）岗位描述：在真实电商场景把生成式 AI 变为可落地、可复制的生产力。你将负责训练、数据与评测体系建设，推动模型从离线指标到在线业务价值的闭环迭代。✨ 三大核心能力：定义问题：把业务目标拆解为可训练/可评估的 ML 问题。数据与训练：构建高质量后训练数据与训练管线（SFT/DPO/RL）。评测与优化：建立量化评测、自动化评估与奖惩机制，指导模型优化。🎯 我们的优势：顶级模型：第一时间接触并实践阿里 Qwen 等 SOTA 模型。完整工程链：数据构建、自动评测、训练优化到推理部署的一体化平台。充足算力：充足训练与推理资源，支持大规模尝试。真实数据闭环：亿级在线反馈，业务驱动快速迭代。快速成长：与一线算法与系统专家深度协作，一对一辅导。主要工作：AI 应用全生命周期：问题建模、上下文工程、训练数据构建、模型后训练优化。数据飞轮：搭建高质量数据生产链，探索合成数据与蒸馏方案。评测体系：设计自动化评测、LLM-as-a-Judge 与在线指标联动体系。强化学习：设计可工程化的 reward 与 RL 训练环境。外部能力：构建 RAG、Memory、工具调用与多 Agent 协作框架。多模态落地：开发视觉/多模态感知与推理能力，解决实际场景问题。基本要求：2027 届毕业生；硕士/博士优先，优秀本科亦可。深刻理解 Transformer 与主流 LLM 架构。具备后训练（SFT/DPO/RL）或 Agent 训练实操经验者优先。扎实 Python 能力，熟练 PyTorch；熟悉 Megatron-LM/DeepSpeed/vLLM 等分布式训练或推理框架。强烈的 Data-centric 思维，能构建高质量训练数据、合成数据和动作轨迹。能设计科学的评测体系并基于评测定位问题（LLM-as-a-Judge 优先）。论文或开源贡献优先：在顶会（ACL/EMNLP/ICLR/NeurIPS/ICML）有相关论文，或为大模型评测 / 高质量数据开源项目做出核心贡献者优先。加分项：Agent / RL / 评测 / 合成数据方向有一线产出。有大规模分布式训练或生产化部署经验。对电商业务有理解者优先。划重点：面试流程快、团队氛围好。欢迎投简历来聊！【联系我们】简历可投递：**********************直投团队leader～

0 点赞评论收藏

分享

创作者周榜

更多

关注他的用户也关注了：

牛客网
牛客网在线编程
牛客网题解
牛客企业服务