饿了么AIGC一面

面试完就知道gg,简直是一个小时的压力面🥲
1. 自我介绍
2. 研究生阶段项目介绍和研究生课程有哪些(直接给我懵了)
3. transformer模型结构
4. self-attention为什么是QKV三个,作者是依据什么构造出来的
5. 梯度消失和梯度爆炸定义,用什么解决
6. Bert的embedding
7. 大模型LLM和transformer的区别,LLM好在哪里
8. LLama模型结构
9. 位置编码方式有几种,为什么旋转位置编码好,好在哪里
10. 为什么GPT采用decoder-only架构,encoder-only为什么不应该更好?
11. 自己的项目和大模型的结合,问了超级多细节,关于微调、RAG
12. 由于没笔试,有两道动态规划代码题:最大正方形和连续子序列最大和
有一些不记得了,很多都是追问深挖。面试一个小时被拷打,后面直接干沉默。面试官一直在问深度问题,当说到具体公式或者细节,总是会被打断说,不用这么细节,而是怎么怎么。而我只是八股菜鸡,后续问得直接回给对方沉默,第一次面试开摆了,代码题第一个没a出来,面试官说下去再看看。
#25届暑期实习##算法实习##算法面经##如何判断面试是否凉了#
全部评论

相关推荐

3 26 评论
分享
牛客网
牛客企业服务