大模型强化对齐算法实习生
300-350元/天
算法工程师 北京 硕士 5天/周 最少3个月

岗位关键词
岗位职责
1.参与多模态价值观强化对齐算法的研发与优化
2.多模态模型对齐数据样本收集处理,模型训练与效果分析
岗位要求
1.对多模态强化对齐算法有浓厚兴趣,熟悉ppo,grpo,rlhf算法原理
2.能够高效处理数据,具备一定的算法开发能力和数据收集、处理能力
3.具备良好的团队协作能力
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请
立即举报