大模型 - 强化学习后端研发实习生
300-500元/天
后端 北京 本科 5天/周 最少6个月

岗位关键词
岗位职责
负责小红书大模型强化学习基础设施的开发,接入并维护强化学习工程环境,加快模型训练速度
探索业界前沿的大模型相关技术,参与研究奖励模型和强化学习模型的泛化性,持续提升模型 Post-Train 能力
岗位要求
重点院校本科及以上学历在读,计算机、软件工程、人工智能等相关专业优先
熟悉 Linux 开发环境,具备良好扎实的算法基础、良好的编程风格和系统设计能力
熟悉服务端基础技术(Go/Java/Python,数据库,消息队列,微服务,多线程等)
了解 TensorFlow/PyTorch等深度学习框架和常见的深度学习算法
有互联网实习经历或个人作品优先,实习时间长于 6 个月优先
* 加分项
对强化学习有了解,对业界前沿的大模型技术有自己的看法
在人工智能顶级会议上有发表过论文的优先
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请
立即举报