强化学习/自然语言/多模态算法工程师

薪资面议
自然语言处理
北京
硕士
1天/周
最少6个月
有转正
岗位关键词
岗位职责
探索强化学习,llm 效果提升,有 dpo,ppo,grpo 等基础
岗位要求
了解 llm 理论基础,有较强代码能力,有 dpo,ppo,grpo 等基础
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报