昆仑天工大模型实习一面面经

第一次面大模型的面试, 八股真的是背了也忘, 汗流浃背。

1. 自我介绍
2. LLAMA 的结构有什么特点?(第一个就汗流浃背, 不知道从哪方面入手说。 我是说 casual lm 的 mask,only decoder, 说 pre layer norm, 说激活函数也不是 relu)
2.由上引发的题, 讲一下 LLAMA 的 layer norm, 我忘记 llama 是 pre rms norm 了,一直没说出来。面试官就想问这个。
3. 讲一下 LLAMA 的激活函数吧。 汗流浃背,就知道是 swiGLU。 我就说那个 swish 函数为头的门控线型单元吧啦吧啦的,说的结结巴巴。公式也没记住。
4. 详细介绍一下 Transformer 的结构。(在 encoder 输入给 decoder 的 K V 我说成了 Q V,然后就说我也记不清是 K 还是 Q 了。。。)
5. 为什么计算注意力 QK 分数要除以维度开根号?为什么不能直接除以维度?(就瞎扯容易数据太小, 收敛太慢巴拉巴拉。。。)
6.讲一下你对  位置嵌入的了解。(绝对位置相对位置一顿输出)
7. 说一下你知道的 tokenizer 的分词办法。(详细说了 bpe, wordpiece 和 unigram 都记不得了,连这两个名词我都说不清)

算法题一个, 岛屿数量。
全部评论
准备了多久大模型呀哈哈哈
点赞 回复 分享
发布于 2024-08-16 19:41 上海
佬,大模型八股在哪里找啊
点赞 回复 分享
发布于 2024-04-11 13:07 北京
m
点赞 回复 分享
发布于 2024-03-25 17:02 陕西
大佬,大模型的八股在哪儿能找到
点赞 回复 分享
发布于 2024-03-19 22:38 浙江

相关推荐

不愿透露姓名的神秘牛友
08-07 14:45
点赞 评论 收藏
分享
已注销:再接着投吧项目经历太流水账,且没有实习经历,我之前也是这样,后来跟着大厂导师修改了项目和简历之后成功上岸,有需要可以问我
点赞 评论 收藏
分享
07-11 18:47
已编辑
门头沟学院 后端
在看数据的孤勇者很想...:如果你是在校硕士,六段大厂实习一眼假,假设一段实习两个月,硕一暑假,硕一寒假,大四暑假,大四寒假,大三寒假,大三暑假,哥们,你怎么卷吗,寒假基本两个月在企业实习不现实,所以你可能是日常实习,但是你不可能每段日常实习都是两个月吧,他们日常实习都是三个月起步这样,所以你往前推一下,一段日常实习,就三个月,敢情你大学生课都不上,全在实习吗?你自己问问自己,六段大厂实习,一点没学到,自己说出来会不会笑呀,不管学历,但凡有一段大厂实习都很牛逼了
投递米哈游等公司10个岗位
点赞 评论 收藏
分享
08-07 11:43
门头沟学院 Java
点赞 评论 收藏
分享
评论
5
40
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务