逐际动力 机器人强化学习实习 一面(挂)

面试时间:5月20日16:00(库名人520面试)
面试岗位:机器人强化学习(实习)
面试问题:

上来就问项目(本人项目是双足机器人RL+locomotion),问题包括,

1. 为什么要设计并行worker并行采样解构?
2. PPO的Loss由哪几项组成?(典中典)
3. 能不能用总的Loss去更新Policy和Value网络?(我是将Loss拆开来分别更新的)
4. 用了多少时间(多少步)来训练达到这个效果?

还问了两个Python的问题,函数前@啥意思(修饰器)

反问

面试体验:聊得挺顺畅的,问答比1:3左右,就是挂。事后总结感觉不缺人。

#面经##具身智能##机器人##强化学习##实习#
全部评论

相关推荐

拿到了秋招第一个offer,简单记录一下,供牛友们参考bg:双c9,非科班,硕士研究方向为机器人控制相关,1篇EI,一篇SCI二作,一段小厂日常实习,机器人强化学习相关时间线:4月底投递,5月份陆续约了三面,面完6月初发了座谈会,到今天(6.10)收到offer一面拷打简历介绍实习工作内容,自己负责哪部分VMC原理?为什么要用VMC训练过程sim2real的gap怎么处理?ppo算法怎么改进的,效果如何?然后是学校项目课题,介绍项目背景,研究创新点,实现过程遥操作时延怎么优化?项目量化指标无八股无手撕二面二面面试官猜测是做嵌入式相关的,对简历上很多项目不太了解机器人部署过程通信实现,spi原理,sdk编写同样是介绍学校课题内容创新点这些,提了一些简单问题常用编程语言?(答:python)于是问会cpp吗(答:会一点,但不多,可以学)cpp和python的区别?反问环节(说实话二面体验相当不好了,有种双方都没get到对方意思的感觉,一些问题答的也不好,面完以为没后续了)三面三面给我的感觉是专业面+综合素质面,整体过程比较轻松愉快同样是介绍实习和课题内容,遇到的问题,怎么解决等等(专业问题和一面的时候大差不差)简单问了下爱好,运动习惯这些反问环节由于面试时间太久了很多细节记不太清了,想到哪里写到哪里了,希望可以给大家提供有用的信息整体tp面下来体验还算不错,可以说全程无八股和手撕,流程推进速度中规中矩,而且算是自己秋招拿到的第一个offer,还是挺满意的
查看11道真题和解析
点赞 评论 收藏
分享
评论
1
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务