作业帮提前批 解题方向 二面面经

1.自我介绍
2.拷打实习

3.给一个huggingface的模型的config算一下我下载下来需要多少磁盘空间(就是假设一下模型的结构,层数,维度什么的都用参数代替,算一下参数量,再转实际大小)
4.前向推理的时候,attention的计算量/时间复杂度(简单的给分析了一下,算了个大概)
5.softmax的时间复杂度
6.flash attention计算的时候为什么每个块都要减去最大值(这块答的不太对,我确实没仔细思考过这个问题
7.实习有没有做LLM 强化学习的研究/实验(答基本上研究DPO系列了,比较方便应用,学校项目训练过RM)

8.手撕 给定严格递增序列,求最大斐波那契子序列的长度

面试官感觉水平挺高的,今天感觉回答的不是很好,整体有点磕绊,希望能过吧,孩子真的很需要第一个offer

-------------
更新,刚写完这篇打电话约HR面了,我去第一次秒过!
全部评论
校友赢麻了
点赞 回复 分享
发布于 2024-08-23 00:16 江苏
问 flash att 是因为简历上有吗? 我都没咋复习过推理训练框架相关的东西。今天刚作业帮 HR 面完。
点赞 回复 分享
发布于 2024-08-19 21:17 北京
我超,***了,经提醒,才发现面试官其实就是想问为什么softmax要减去最大值,为了防止值溢出,确实是常规softmax实现的时候都操作,我一直在想为什么flash attention要这样操作,淦!
点赞 回复 分享
发布于 2024-08-19 15:40 北京

相关推荐

10-15 18:02
已编辑
香港中文大学 golang
秋招有幸一开始就拿了淘天的笔面,并且美团转正的意向也顺利通过后续在淘天和字节两个 9 月主要流程都走到了 hr 面,国庆节后一个通过,一个横向挂了其他面过的包括:b 站一面挂 八股还行,最后手撕给了个笔试压轴限时 15min...整段垮掉阿里控股 kpi一面➕换部门走到二面,控股的都不喜欢开摄像头京东一面挂 常规问题,但是疑似成都 base hc 很少,并且透露了已经转正,目前池子里无人捞腾讯正在二面 一面体验不错,还指出了要改进的地方,提示二面不会再问问过的问题快手一面未知小红书一面未知字节换部门一面不喜欢业务,又回到了人才库大麦约面,准备拒掉虾皮一面 无后续流程,面试聊的还行,感觉上海 base 池子满了---------------------------------------------------------------------------感觉秋招可以结束了,后续感觉走完这个腾讯流程就随缘面面 t 和 b,主包家在南京,奈何南京没啥好的民营企业和互联网氛围,以及好国企又太难进,不知道淘天这个意向够不够直接结束秋招了...今天去深圳 nip 主场看了一下入围赛,主队不是这两家,还是觉得 ig 可惜了,有很好的机会没有抓住。感触和我字节 hr 面挂一样评论区有推荐的字节杭州上海base的业务线或者有字节 hr uu 可以捞一下吗?
肖先生~:大佬都这么强了还要干啥啊
我的求职进度条
点赞 评论 收藏
分享
肖先生~:那年秋招闯进一位少年,人们都清楚:成功对他来说只是时间问题
点赞 评论 收藏
分享
评论
3
17
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务