安克 具身智能算法面经

感觉良好,发下面经攒攒人品
八股:
RL:
1.说一下策略梯度公式
2.为什么可以对期望求导
3.如何解决方差大的问题
4.baseline为什么能降低方差,引入后会不会产生偏执?
5.简单介绍一下Baseline类型
6.机械臂抓取用什么baseline

规控mpc:
1.问:说一下MPC的原理,和LQR PID有什么区别
2.MPC实时应用中如何保证求解速度,求解失败怎么办

求解速度:
1.先考虑非线性转换成线性和凸优化
2.优化求解器选择,如果是小型 QP且快速响应的话一般来说,会用 qpOASES,如果是稀疏的大规模 QP(比如自动驾驶的 MPC),OSQP 更合适
3.  算法代码上优化,稀疏矩阵和并行计算
全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务