斩获自动机 level
获赞
1
粉丝
0
关注
8
看过 TA
13
南京大学
2024
Java
IP属地:香港
暂未填写个人简介
私信
关注
03-12 21:09
南京大学 Java
岗位名称: AI Agent 优化工程师(训练 / 数据 / 评测方向)岗位描述:在真实电商场景把生成式 AI 变为可落地、可复制的生产力。你将负责训练、数据与评测体系建设,推动模型从离线指标到在线业务价值的闭环迭代。✨ 三大核心能力:定义问题:把业务目标拆解为可训练/可评估的 ML 问题。数据与训练:构建高质量后训练数据与训练管线(SFT/DPO/RL)。评测与优化:建立量化评测、自动化评估与奖惩机制,指导模型优化。🎯 我们的优势:顶级模型:第一时间接触并实践阿里 Qwen 等 SOTA 模型。完整工程链:数据构建、自动评测、训练优化到推理部署的一体化平台。充足算力:充足训练与推理资源,支持大规模尝试。真实数据闭环:亿级在线反馈,业务驱动快速迭代。快速成长:与一线算法与系统专家深度协作,一对一辅导。主要工作:AI 应用全生命周期:问题建模、上下文工程、训练数据构建、模型后训练优化。数据飞轮:搭建高质量数据生产链,探索合成数据与蒸馏方案。评测体系:设计自动化评测、LLM-as-a-Judge 与在线指标联动体系。强化学习:设计可工程化的 reward 与 RL 训练环境。外部能力:构建 RAG、Memory、工具调用与多 Agent 协作框架。多模态落地:开发视觉/多模态感知与推理能力,解决实际场景问题。基本要求:2027 届毕业生;硕士/博士优先,优秀本科亦可。深刻理解 Transformer 与主流 LLM 架构。具备后训练(SFT/DPO/RL)或 Agent 训练实操经验者优先。扎实 Python 能力,熟练 PyTorch;熟悉 Megatron-LM/DeepSpeed/vLLM 等分布式训练或推理框架。强烈的 Data-centric 思维,能构建高质量训练数据、合成数据和动作轨迹。能设计科学的评测体系并基于评测定位问题(LLM-as-a-Judge 优先)。论文或开源贡献优先:在顶会(ACL/EMNLP/ICLR/NeurIPS/ICML)有相关论文,或为大模型评测 / 高质量数据开源项目做出核心贡献者优先。加分项:Agent / RL / 评测 / 合成数据方向有一线产出。有大规模分布式训练或生产化部署经验。对电商业务有理解者优先。划重点:面试流程快、团队氛围好。欢迎投简历来聊!【联系我们】简历可投递:**********************直投团队leader~
0 点赞 评论 收藏
分享

创作者周榜

更多
关注他的用户也关注了:
牛客网
牛客网在线编程
牛客网题解
牛客企业服务