大模型强化对齐算法实习生

300-350元/天
算法工程师
北京
硕士
5天/周
最少3个月
岗位关键词
岗位职责
1.参与多模态价值观强化对齐算法的研发与优化 2.多模态模型对齐数据样本收集处理,模型训练与效果分析
岗位要求
1.对多模态强化对齐算法有浓厚兴趣,熟悉ppo,grpo,rlhf算法原理 2.能够高效处理数据,具备一定的算法开发能力和数据收集、处理能力 3.具备良好的团队协作能力
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报
理想汽车
汽车制造
已上市
北京、上海、深圳、常州、绵阳
查看其他 27 个职位