网易雷火强化学习凉面

HR直接发了两轮面试的链接
第一轮:
介绍自己的项目(我用强化学习PPO、DQN做的小demo)
之前一直都在准备机器学习岗的面试就没有准备强化学习的相关知识,真是一点都想不起来
然后开始问Policy Gradient,了不了解A3C的结构,KL散度怎么计算、DQN的改进方法。。。
看我强化学习的问题都不记得就选择问深度学习= =,但是我还是不会
如何解决过拟合,了不了解BN。。。
后来做了一道算法题 一个二维数组从左到右,从上到下都是增大的 找一个数,又问了时间复杂度
第二轮:
直接问DQN的损失函数,
python多线程缺点、了不了解生成器、还有python的命名规则。。
后来都说不上来就放弃了,问我会什么,我说会机器学习,可是面的是强化学习。。。就异常尴尬

总结:
投了好多家公司的实习,只有网易雷火跟我课题比较匹配,但是在找实习的过程中,感觉找机器学习岗的公司可能都对强化学习不会很感兴趣,我个人觉得强化学习不太适合现在的找工作,个人也不想以后工作做强化学习,所以也没有把精力放在这方面,凉了也是自然。
#网易##面经##机器学习##提前批##实习##算法工程师#
全部评论
那你为什么投强化学习岗
点赞 回复
分享
发布于 2019-04-19 22:36
哈工大今年秋招情况怎么样啊
点赞 回复
分享
发布于 2019-04-20 09:12
百信银行
校招火热招聘中
官网直投
LZ你投的是——伏羲AI实验室,人工智能研究员:强化学习方向吗,我也投了这个,笔试后没有任何消息
点赞 回复
分享
发布于 2019-04-21 14:27
感觉笔试好难,没用过,,难受
点赞 回复
分享
发布于 2019-04-24 00:28
4年前的面试了,这些我都会...今年投了网易雷火强化学习方向,希望还问这些
点赞 回复
分享
发布于 2023-03-08 21:22 浙江

相关推荐

1.自我介绍2.抓着项目的一些问面试官喜欢问从顶层的实验设计的一些东西我的实验为什么要选用 cos 距离或者 mse?能不能用 KL散度?是不能用还是不好用?KL 散度和交叉熵的区别和联系是什么?(都是我没考虑过的问题 有点汗流浃背)既然你用到了那么多微调方式, 那你有什么实验过程中探究了 lora 的比如 秩之类的参数的影响吗?prompt tuning  ptuning v2 有啥区别?(说完他觉得我说的太八股太宏观了,又讲了一堆原理)为什么 p v 2 比 prefix tuning 要减去那个 lstm 和 linear? 我说论文里说适配 NLG 任务,好像记错了。有没有接触过强化学习?为什么你们只考虑微调,是因为啥原因?你是用几张卡跑实验?多大参数的模型?跑的时候内存占用量多大?有没有试过全量微调? 那你想一下,假如我用 deepspeed 的几种版本, 全量微调7B 模型,内存占用多大?最后大概的意思就是说他比较看重实验最初的一些设计能力, 不能蹬 OOM 再来解决。让我之后要多理解一下 deepspeed。说社招看的多这些理解能力。反正基本上就是项目围绕讲。 后面说我项目做的,工程应该能力不错。 代码题也是那种很简单的处理数据。
点赞 评论 收藏
转发
头像
04-02 17:25
web前端
点赞 评论 收藏
转发
7 38 评论
分享
牛客网
牛客企业服务