大模型后训练工程师

薪资面议
算法工程师
上海
硕士
2024届
岗位关键词

毕业要求:2024届

投递时间:2025年4月4日-2027年5月4日

岗位职责
华为计算大模型后训练实习生招聘 工作内容: 主要负责大模型的后训练( post - training )工作,提升模型性能。具体任务包括但不限于监督微调( SFT )和基于人类反馈的强化学习( RLHF )。你将参与模型优化、算法改进以及实验设计,协助团队解决实际问题并推动技术进步。
岗位要求
1.对大模型充满热情,熟悉主流的后训练技术,尤其是强化学习相关技术,如 PPO 和 GRPO 。 2.需具备顶级会议(如 ACL 、 EMNLP 、 NIPS 、 ICML 、 ICLR 、 CVPR 、 ICCV 、 ECCV )的一作发表或投稿经验。 3.有大规模强化学习训练经验者优先考虑。 4.具备扎实的编程能力,熟悉 Python 及相关机器学习框架(如 TensorFlow 、PyTorch ). 5. 良好的团队合作能力和沟通技巧,能够在协作环境中高效工作。
练秋湖
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报
上海华为技术有限公司
通信电子
未融资
上海
查看其他 51 个职位