发顶刊 大模型Function Calling强化学习实习生

380-600元/天
深度学习
深圳
硕士
5天/周
最少6个月
有转正
岗位关键词
岗位职责
【工作职责】 1. Function Calling数据集设计与处理:设计、构建和清洗用于训练和评估LLM Function Calling能力的高质量数据集。 2. Function Calling场景的LLM训练:负责或参与在Function Calling特定场景下的大语言模型后训练(Post-training)工作,包含不限于强化学习微调等。 3. 模型效果优化与评估:持续提升模型在具体场景中的Function Calling效果(如成功率、准确性、效率)或者模型在相关公开评测榜单(如ToolBench, API-Bank等)上的表现,并针对性进行优化。 4. 技术创新与研究:针对Function Calling训练中的挑战(如奖励设计、样本效率、策略优化等),提出创新的强化学习算法或训练方法改进方案。将研究成果沉淀并撰写成高质量技术报告或学术论文,目标是发表于顶级会议(顶会)。
岗位要求
【任职要求】 1. 计算机科学、人工智能、数学、统计学或相关专业在读硕士/博士研究生(优秀本科生亦可考虑)。 2. 深入理解并熟练掌握主流强化学习算法,特别是 PPO、GSPO 及其变种。具备动手实现或调优相关算法的经验。 对大语言模型(LLM) 的基本原理、训练/微调流程(尤其是RLHF/RLAIF)有扎实理解。 加分: 了解或接触过 Function Calling / Tool-Using 相关技术或项目。 3. 在人工智能、机器学习、自然语言处理等领域有顶级会议(NeurIPS, ICML, ICLR, ACL, EMNLP等)论文发表经历者优先。具备良好的问题分析、算法设计能力和严谨的实验评估习惯。 4. 对LLM和强化学习技术充满强烈的技术热情,渴望在AI前沿领域进行探索并做出实际贡献。 5. 良好的沟通能力和团队协作精神。
深圳市福田区市花路5号长富金茂大厦1号楼39楼
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报
粤港澳大湾区数字经济研究院
研究所
不需要融资
深圳
查看其他 25 个职位