RL算法实习生
400-600元/天
机器学习 南京 硕士 5天/周 最少3个月 有转正

岗位关键词
岗位职责
岗位职责
1、负责强化学习算法的研究和开发,以及模型的优化和调整,并将模型应用到具体业务场景中,保证模型的准确性和实时性;
2、根据项目和客户需求,负责应用机器学习、强化学习算法解决实际问题;
3、完成与开发内容对应的相关文档写作,阶段性输出项目进度文档和汇报PPT;
4、负责将已开发完成的算法或智能体与仿真对接、保证在实际环境中能达到测试环境中同等性能;
5、参与团队的技术分享和交流,推动技术创新和进步。
岗位要求
知识与技能
1、精通一种或多种常用的深度强化学习算法(PPO、SAC、DON、DDPG、A3C等); 深刻理解强化学习的核心理论,如马尔可夫决策过程、Q 学习、深度 Q 网络(DQN)及其扩展算法(如 DDQN、Dueling DQN)、策略梯度算法(如 A2C、A3C、PPO)等;
2、具有分析需求,解决问题解决能力:具备敏锐的问题分析与解决能力,在模型训练出现异常(如梯度消失 / 爆炸、模型不收敛等)时,能够迅速定位问题根源,并提出有效的解决方案;能够对算法进行优化,提升模型性能与效率,如减少训练时间、降低资源消耗等。
3、需具备良好的沟通能力,能够与项目团队通过线上方式保持密切沟通,定期汇报项目进展;能够理解客户需求,并将其转化为技术实现方案。
4、有一定强化学习项目经验或论文发表优先;抗压能力强;
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请
立即举报