算法强化学习实习生

200-400元/天
算法工程师
深圳
不限
5天/周
最少3个月
有转正
岗位关键词
岗位职责
方向一:大模型,有llm训练经验,有强化学习经验,有MCTS,RL,RLHF,PPO,DPO,GRPO经验加分 方向二:文生图,Stable difussion模型,ComfyUI等框架使用经验丰富 方向三:训练过语音大模型,会transformers,有Encodec,Helium,RVQ经验加分
岗位要求
工作职责: 1、负责多模态大模型的微调 2、探索并实现多模态大模型的模态对齐、高效训练、指令微调及性能评估等关键 技术要求: 1、硕士、博士学历,有扎实的数据结构和算法基础,有较强的实践能力 2、熟练掌握pytorch,transformers等LLM 领域相关工具,有bert,vision-transformer,llm实践经验;有强化学习、MCTS、RL、RLHF等经验 3、熟悉和实践深度学习算法(vision-transformer,LLAMA,GPT系列等),发表过顶刊或会议论文优先,如ICML、NIPS、ICCV、ECCV、CVPR、ACL、EMNLP、COLING等;有竞赛经验者优先。 4、有强烈的求知欲、好奇心和进取心,有快速学习新技术的能力
南山区南山智园c2栋19楼
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报
深圳市新旦智能科技有限责任公司
人工智能
A轮
深圳市
查看其他 5 个职位