腾讯AI-lab强化学习面经(已跪)

上来两个算法题

1.找旋转数组的旋转点。二分法比较简单
2.跳n台阶,一次可以跳随意个台阶,求跳的台阶数之积的最大值
dp写法O(n2)可以过,面试官问有无O(nlogn)乃至O(1)的数学解,想了2分钟,想不出

问ppo有replay buffer和importance sampling 是 onpolicy 还是offpolicy?基础没打好,这个基础题答错了
结束后10分钟查看网页情况,已经结束,跪的好快。。。。


#腾讯##面经##算法工程师#
全部评论
跳n台阶,一次可以跳随意个台阶,求跳的台阶数之积的最大值 这个是跳很多个3 吗
点赞 回复 分享
发布于 2021-04-28 22:02
问ppo有replay buffer和importance sampling 是 onpolicy 还是offpolicy? 这个答案是off policy吗
点赞 回复 分享
发布于 2021-04-25 16:29
楼主你好,请问你是实习、校招还是社招?
点赞 回复 分享
发布于 2021-04-24 17:46
这个是AI 平台部 不是AI LAB,别问我为啥知道的😐
点赞 回复 分享
发布于 2021-03-30 20:12

相关推荐

程序员饺子:正常 我沟通了200多个 15个要简历 面试2个 全投的成都的小厂。很多看我是27直接不会了😅
点赞 评论 收藏
分享
评论
2
20
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务