【27届留用实习生】大模型算法(Agent基础能力方向)-大模型中心
薪资面议
算法工程师 上海 不限 4天/周 最少3个月 有转正

岗位职责
1、负责智能体核心能力的研发与工程化:提升语言模型和多模态模型在多轮交互、Function Calling、结合Agent框架的决策与推理等场景的稳定性与泛化能力;
2、参与 SFT 与 Agentic RL 的数据设计与构建:参与智能体任务的数据设计、生成与清洗流程,构建高质量用于SFT与RL的Function Calling训练数据;
3、参与模型训练与调优:参与大模型的SFT、Agentic RL等训练流程,优化模型在多轮对话、工具调用、决策推理任务中的表现;
4、Agent系统协同开发:构建基于大模型的Agent平台原型,支持模型推理以及工具调用等功能;
5、评测体系设计与分析:设计Agent能力相关的评测任务和指标,追踪训练效果,驱动训练闭环优化;
岗位要求
1、熟悉大模型训练与微调流程:具有LLM或多模态模型训练经验,熟悉SFT、RLHF等方法;
2、Agent相关实践:了解或参与过智能体系统构建,包括任务规划、函数调用等功能模块的设计与实现;
3、强化学习基础:熟悉RL基础知识以及RL在大模型微调中的应用,特别是LLM reasoning, Agentic RL等场景下的训练,熟悉verl等训练框架优先;
4、工程实现能力:熟练使用Python,熟悉PyTorch等主流深度学习框架,具备扎实的代码能力;
5、线下实习优先,每周出勤天数≥4天,能实习6个月及以上优先。
【加分项】
参与开发过有影响力的开源智能体项目(如基于LangChain、LangGraph等的项目);
在主流agent类benchmark上有开源贡献,或在ACM/ICPC,Kaggle等竞赛中取得过优异成绩优先;
在顶级会议/期刊(NeurlPS,ICML,ICLR,ACL,EMNLP等)以一作或主要贡献者身份发表论文优先;
具备数据构建、自动标注、数据质量验证的实战经验;
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请
立即举报