逐际动力 机器人强化学习实习 一面(挂)
面试时间:5月20日16:00(库名人520面试)
面试岗位:机器人强化学习(实习)
面试问题:
上来就问项目(本人项目是双足机器人RL+locomotion),问题包括,
1. 为什么要设计并行worker并行采样解构?
2. PPO的Loss由哪几项组成?(典中典)
3. 能不能用总的Loss去更新Policy和Value网络?(我是将Loss拆开来分别更新的)
4. 用了多少时间(多少步)来训练达到这个效果?
还问了两个Python的问题,函数前@啥意思(修饰器)
反问
面试体验:聊得挺顺畅的,问答比1:3左右,就是挂。事后总结感觉不缺人。
#面经##具身智能##机器人##强化学习##实习#
面试岗位:机器人强化学习(实习)
面试问题:
上来就问项目(本人项目是双足机器人RL+locomotion),问题包括,
1. 为什么要设计并行worker并行采样解构?
2. PPO的Loss由哪几项组成?(典中典)
3. 能不能用总的Loss去更新Policy和Value网络?(我是将Loss拆开来分别更新的)
4. 用了多少时间(多少步)来训练达到这个效果?
还问了两个Python的问题,函数前@啥意思(修饰器)
反问
面试体验:聊得挺顺畅的,问答比1:3左右,就是挂。事后总结感觉不缺人。
#面经##具身智能##机器人##强化学习##实习#
全部评论
相关推荐

点赞 评论 收藏
分享