大模型后训练工程师
薪资面议
算法工程师 上海 硕士 2024届

岗位关键词
毕业要求:2024届
投递时间:2025年4月4日-2027年5月4日
岗位职责
华为计算大模型后训练实习生招聘
工作内容:
主要负责大模型的后训练( post - training )工作,提升模型性能。具体任务包括但不限于监督微调( SFT )和基于人类反馈的强化学习( RLHF )。你将参与模型优化、算法改进以及实验设计,协助团队解决实际问题并推动技术进步。
岗位要求
1.对大模型充满热情,熟悉主流的后训练技术,尤其是强化学习相关技术,如 PPO 和 GRPO 。
2.需具备顶级会议(如 ACL 、 EMNLP 、 NIPS 、 ICML 、 ICLR 、 CVPR 、 ICCV 、 ECCV )的一作发表或投稿经验。
3.有大规模强化学习训练经验者优先考虑。
4.具备扎实的编程能力,熟悉 Python 及相关机器学习框架(如 TensorFlow 、PyTorch ).
5. 良好的团队合作能力和沟通技巧,能够在协作环境中高效工作。
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请
立即举报