B站二面凉经

📍面试公司:bilibili
💻面试岗位:大模型
❓面试问题:
1. 从理论上为什么用dpo
2. dpo的beta是什么意思
3. dpo训练不符合要求的时候怎么办
4. ppo的奖励稀疏化怎么办
5. dpo的做法上有什么难处,从数据和模型上来说
6. on-policy和off-policy
7. dpo的loss
#发面经攒人品##bilibili求职进展汇总#
全部评论
沾沾凉气,希望我别遇到这地狱难度😇
点赞 回复 分享
发布于 09-16 13:54 山东
楼主敢面大模型岗就是勇士!respect
点赞 回复 分享
发布于 09-16 13:54 湖南
感觉在面PhD岗位,我本科不配了
点赞 回复 分享
发布于 09-16 13:54 上海
奖励设计是大模型玄学,面官自己懂吗
1 回复 分享
发布于 09-16 13:54 山东
感谢分享,避坑了!
点赞 回复 分享
发布于 09-16 13:53 陕西
Beta是调优重点啊,答上来已经很强了!
点赞 回复 分享
发布于 09-16 13:53 河南
凉就凉吧,反正GPT能答这些题
点赞 回复 分享
发布于 09-16 13:51 黑龙江
DPO训练不符合要求?我也不符合B站要求
点赞 回复 分享
发布于 09-16 13:51 山东
可惜了,害
点赞 回复 分享
发布于 09-16 12:58 广东

相关推荐

11-19 09:45
已编辑
门头沟学院 Java
bg:2本9硕,第一段实习胆小🐭未投递bat整体timeline:10.9开始投递 除jdy外 10.23都已经结束美团(数据平台部)一面 二面 oc蚂蚁(Oceanbase某边缘部门)一面 二面拒绝(脑子进水了)快手(大模型应用开发)一面挂虾皮 (保险那边业务)一面 二面挂京东jdy(京东科技)一面 二面 三面 oc百度(用增后端)一面挂b站 (cicd流水线)一面挂滴滴 (mpt引擎架构)一面过 二面oc面试一些更具体部门或者业务,这里就不展开了,有感兴趣的同学可以私聊面经~一点感想:1.越来越卷了,认识了很多27届的小伙伴现在已经2-3段实习了2.大模型应用开发是趋势,在你学历以及简历深度到位的基础上,了解甚至熟悉大模型应用开发的东西会帮助你脱颖而出,最少能多很多面试(实测),但是也存在一个小风险:简历靠大模型吸引来的,可能一般也只是组里应上面okr要求要做agent,招你进去随便做一个,成长性堪忧,但是总比啥都不做好。3.自己做的项目,不管是点评还是什么其他各种秒杀 电商等,可以想办法多体现一些与众不同,面试官们真看腻了,他们都能给你全文背诵你简历的描述,最重要的在于项目复杂度,一定新颖程度描述到位的基础上,多结合个人的思考,没接触的场景或者问题,玩命调动自己做项目的过程经验以及结合一定八股来回答,在面试官那边印象不会差的4.算法这块,感觉绝大部分厂不会太为难,我手撕十多道的经验上来看,没有超出hot100及其简单变式,不用太担心5.最重要的还是运气,运气面前一切实力高低与否都显得很渺小而运气又和投递时期挂钩,短时间内如果没有面试或者面试结果不尽人意,不用着急,可以继续投递的同时一边优化简历和熟悉八股算法,没准哪天某大厂缺人就一面速通你了,幸福往往就在一瞬间~祝大家都能找到自己满意的实习~也欢迎同一届的后端小伙伴们一起多多交流
发面经攒人品
点赞 评论 收藏
分享
评论
2
6
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务