算法强化学习实习生
200-400元/天
算法工程师 深圳 不限 5天/周 最少3个月 有转正

岗位关键词
岗位职责
方向一:大模型,有llm训练经验,有强化学习经验,有MCTS,RL,RLHF,PPO,DPO,GRPO经验加分
方向二:文生图,Stable difussion模型,ComfyUI等框架使用经验丰富
方向三:训练过语音大模型,会transformers,有Encodec,Helium,RVQ经验加分
岗位要求
工作职责:
1、负责多模态大模型的微调
2、探索并实现多模态大模型的模态对齐、高效训练、指令微调及性能评估等关键
技术要求:
1、硕士、博士学历,有扎实的数据结构和算法基础,有较强的实践能力
2、熟练掌握pytorch,transformers等LLM 领域相关工具,有bert,vision-transformer,llm实践经验;有强化学习、MCTS、RL、RLHF等经验
3、熟悉和实践深度学习算法(vision-transformer,LLAMA,GPT系列等),发表过顶刊或会议论文优先,如ICML、NIPS、ICCV、ECCV、CVPR、ACL、EMNLP、COLING等;有竞赛经验者优先。
4、有强烈的求知欲、好奇心和进取心,有快速学习新技术的能力
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请
立即举报