昆仑天工大模型实习一面面经

第一次面大模型的面试, 八股真的是背了也忘, 汗流浃背。

1. 自我介绍
2. LLAMA 的结构有什么特点?(第一个就汗流浃背, 不知道从哪方面入手说。 我是说 casual lm 的 mask,only decoder, 说 pre layer norm, 说激活函数也不是 relu)
2.由上引发的题, 讲一下 LLAMA 的 layer norm, 我忘记 llama 是 pre rms norm 了,一直没说出来。面试官就想问这个。
3. 讲一下 LLAMA 的激活函数吧。 汗流浃背,就知道是 swiGLU。 我就说那个 swish 函数为头的门控线型单元吧啦吧啦的,说的结结巴巴。公式也没记住。
4. 详细介绍一下 Transformer 的结构。(在 encoder 输入给 decoder 的 K V 我说成了 Q V,然后就说我也记不清是 K 还是 Q 了。。。)
5. 为什么计算注意力 QK 分数要除以维度开根号?为什么不能直接除以维度?(就瞎扯容易数据太小, 收敛太慢巴拉巴拉。。。)
6.讲一下你对  位置嵌入的了解。(绝对位置相对位置一顿输出)
7. 说一下你知道的 tokenizer 的分词办法。(详细说了 bpe, wordpiece 和 unigram 都记不得了,连这两个名词我都说不清)

算法题一个, 岛屿数量。
全部评论
准备了多久大模型呀哈哈哈
点赞 回复 分享
发布于 2024-08-16 19:41 上海
佬,大模型八股在哪里找啊
点赞 回复 分享
发布于 2024-04-11 13:07 北京
m
点赞 回复 分享
发布于 2024-03-25 17:02 陕西
大佬,大模型的八股在哪儿能找到
点赞 回复 分享
发布于 2024-03-19 22:38 浙江

相关推荐

2025年10月3日中午,在写完定时一年后发给自己的信之后,敲下键盘,写下这篇文字。我把标题的“所有人”加了引号,因为如我们所见,确实有的人顺风顺水,每天过的很开心,或是早早进入大厂,或是年纪轻轻就拿到了高薪offer,或是过着可能我努力十年也不一定实现的生活。但也许,不是每个人的痛苦都能被别人看到的,这个月我经常会哭,被骗6000块钱、手上钱不够导致拖欠房租、生活还要借朋友钱、国庆长假也没有钱去旅游,互联网公司不稳定担心试用期不过(毕竟上段实习就是被裁了,一有点风吹草动就害怕),但这样的我,不是所有人都知道的,居然是有些朋友的羡慕对象。回忆我的七年“长跑”别人都是多年幸福的恋爱长跑,我没有恋...
故事和酒66:让每一颗种子找到合适自己的生长方式,最终绽放出独一无二的花朵,这远比所有人都被迫长成同一棵“参天大树”的世界,更加美好和富有生机。这是社会和环境的问题,而不是我们的问题。然而就是在这样的环境中,楼主依然能突破自我,逆势成长,其中的艰辛可想而知。这一路的苦难终究会化作你成长的养料
你小时候最想从事什么职业
点赞 评论 收藏
分享
不愿透露姓名的神秘牛友
09-29 11:20
点赞 评论 收藏
分享
08-11 16:33
门头沟学院 Java
码农索隆:很好,你很棒,但是.... 我举报了!!!
字节跳动开奖374人在聊
点赞 评论 收藏
分享
故事和酒66:假设一下,就算报了培训班,不还是要投简历,只是项目改了。那不如先写几个培训班的项目,纯靠编,然后试试有没有面试。如果真有再报也不迟,如果没有还是没有,那就不是培训班的问题了。
点赞 评论 收藏
分享
评论
5
40
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务