云鲸智能 具身智能算法校招面经

发一下问题给大家参考,攒攒人品!
1. 数采原理
2. rtc原理,rtc有哪些重要参数,t和s的关系,怎么计算
3. ppo原理,同策略和异策略有什么区别,ppo属于哪种?
4. 重要性采样是什么,为什么ppo要用重要性采样?
5. GAE公式里,当λ=0.95时,第10步的TD残差权重会衰减到多少?假如灵巧手抓取任务中,需要精确控制最后1秒的动作,这个λ值是否合理?假如不合理调整的思路是什么
5. 仿真中用ppo训练四足机器人行走,policy loss震荡剧烈但valueloss稳定下降,说一下可能的原因
全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务