RL算法实习生

400-600元/天

机器学习

硕士

5天/周

最少3个月

有转正

姚先生

图灵深视（苏州）科技有限公司·HR

反馈率：100%

岗位关键词

岗位职责

岗位职责 1、负责强化学习算法的研究和开发，以及模型的优化和调整，并将模型应用到具体业务场景中，保证模型的准确性和实时性； 2、根据项目和客户需求，负责应用机器学习、强化学习算法解决实际问题； 3、完成与开发内容对应的相关文档写作，阶段性输出项目进度文档和汇报PPT； 4、负责将已开发完成的算法或智能体与仿真对接、保证在实际环境中能达到测试环境中同等性能； 5、参与团队的技术分享和交流，推动技术创新和进步。

岗位要求

知识与技能 1、精通一种或多种常用的深度强化学习算法(PPO、SAC、DON、DDPG、A3C等); 深刻理解强化学习的核心理论，如马尔可夫决策过程、Q 学习、深度 Q 网络（DQN）及其扩展算法（如 DDQN、Dueling DQN）、策略梯度算法（如 A2C、A3C、PPO）等； 2、具有分析需求，解决问题解决能力：具备敏锐的问题分析与解决能力，在模型训练出现异常（如梯度消失 / 爆炸、模型不收敛等）时，能够迅速定位问题根源，并提出有效的解决方案；能够对算法进行优化，提升模型性能与效率，如减少训练时间、降低资源消耗等。 3、需具备良好的沟通能力，能够与项目团队通过线上方式保持密切沟通，定期汇报项目进展；能够理解客户需求，并将其转化为技术实现方案。 4、有一定强化学习项目经验或论文发表优先；抗压能力强；

紫东国际创意园(紫东路)紫东路2号C21栋

牛客安全提示：如发现虚假招聘、广告，或以任何名义索要证件、费用，或诱导异地入职、参与培训等均属违法行为，发现请立即举报

图灵深视

企业服务

未融资

北京市

查看其他 1 个职位

0 笔试题目 2 面试经验 0 面试短评