找不到实习的大摆子 level
获赞
1007
粉丝
624
关注
3
看过 TA
1.2W
北京大学
2025
自然语言处理
IP属地:重庆
暂未填写个人简介
私信
关注
第一次面大模型的面试, 八股真的是背了也忘, 汗流浃背。1. 自我介绍2. LLAMA 的结构有什么特点?(第一个就汗流浃背, 不知道从哪方面入手说。 我是说 casual lm 的 mask,only decoder, 说 pre layer norm, 说激活函数也不是 relu)2.由上引发的题, 讲一下 LLAMA 的 layer norm, 我忘记 llama 是 pre rms norm 了,一直没说出来。面试官就想问这个。3. 讲一下 LLAMA 的激活函数吧。 汗流浃背,就知道是 swiGLU。 我就说那个 swish 函数为头的门控线型单元吧啦吧啦的,说的结结巴巴。公式也没记住。4. 详细介绍一下 Transformer 的结构。(在 encoder 输入给 decoder 的 K V 我说成了 Q V,然后就说我也记不清是 K 还是 Q 了。。。)5. 为什么计算注意力 QK 分数要除以维度开根号?为什么不能直接除以维度?(就瞎扯容易数据太小, 收敛太慢巴拉巴拉。。。)6.讲一下你对  位置嵌入的了解。(绝对位置相对位置一顿输出)7. 说一下你知道的 tokenizer 的分词办法。(详细说了 bpe, wordpiece 和 unigram 都记不得了,连这两个名词我都说不清)算法题一个, 岛屿数量。
0 点赞 评论 收藏
分享
emm 腾讯加班看起来真严重,假期晚上还约面试。假期前接到电话约面,但是是上海腾讯,我在北京,然后面试官说具体啥时候能到后面二面三面再跟他 leader 说(我心想不会是实习生来面试吧),反正约面试试。上来先让我自我介绍,然后说了一下他们组是干什么的,最后我反问也是问这个,他们组是 IEG 的游戏数据处理的客户端前端开发,不是很懂。1.你这个 webserver 能介绍一下吗?(途中提问了几个简单问题,比如工作线程做什么内容,是怎么被 HTTP 请求唤醒的,感觉问得很简单。。。)2.智能指针的 shared unique ptr 的区别是什么?在什么场景下使用?(什么比场景这块我还真没太注意,就随便说了多线程用 shared ,也不知道是不是对的)3.C++11 的移动语意你了解吗?(我就介绍了右值引用,move 啥的)移动有什么优势吗?4.进程和线程有什么区别?你刚提到了进程的虚拟地址空间,能仔细说一下有哪些部分吗?5.你在写 C++的时候,会有哪些常见的问题导致崩溃?(回答应该是野指针、地址越界、内存泄漏这样的)6.常见的数据结构有哪些?就拿树来说,B 树和 B+树有什么区别?B+树经常被应用在什么地方?树有哪些遍历方式(我听成了二叉树,说了四种,但是好像问题不大)。可以给我描述一下如何实现层序遍历吗?不用代码实现。7.进程间通信有哪几种方式?(我回答完问他要不要解释一下,他说时间比较久了,就不用了)然后最后问我就是可能要做一些 IOS 或者安卓客户端,介不介意其他语言。然后就是反问阶段。面试官最后说会和他 leader 评估后,有结果大概节后联系。面试官非常有礼貌,但是感觉像 KPI 面。因为他知道我大概率不会去上海,而且问的都不深入,也没有手撕代码。     
投递腾讯等公司9个岗位
0 点赞 评论 收藏
分享
从 16 号投简历到今天拿字节 offer 是 12 天,在五一前最后一个工作日结束流程也算是让我能过个好假。想总结一下我个人认为应该注意的项,小米和字节的面经之前都发在动态里了,有兴趣的可以看看。1.面试官非常在意实习时长。我从一面开始就和面试官说我想深入了解项目,会实习的比较久。HR 面实际上就是看你实习多久,HR 会和面试的面试官提前交流,所以能在技术面中就透露出自己实习时长久会比较好。HR 面真的有挂人的,被挂很多都是因为被 HR认为实习时间可能不长(比如说出想刷多段大厂实习经历这种观点)。我个人认为段数并不重要,质量可能更重要一些。2.运气大于努力,有 HC 的时候什么都好说。字节两面技术面就结束,第二年问的技术内容也不多,并且从周三一面到周五 HR 面拿 offer,我认为是他们缺人,希望五一前定下来,早点入职。所以在当前阶段,日常实习 HC 整体比较少(给我面试的大厂实际上非常少),找不到实习不是自己水平问题,更可能是时间节点不好,不要妄自菲薄。3.一直没有面试可以换个方向试试。我投腾讯后台十天无人问津,转岗冷门方向后第二天被捞面试。所以要海投,不仅是公司海投,岗位也要海。4.一个合适的内推还是比较重要的。字节找学长内推同一个部门,当天就过筛简历了。而直到今天,网易才刚过了我两个岗位初筛,京东滴滴 momenta 初筛都没筛。。。百度图森还挂简历。5.Cpp 相对比较重基础,像虚函数表、move 和智能指针,基本上大小厂轮轮面。Cpp primer 我觉得很有必要看。6.项目不怕烂大街,怕学的不深入。我做的 webserver 够烂大街了,还只实现了 GET。面试官照样愿意问,每次自我介绍我都会说做了一个非常经典的服务器项目,也学习到了很多。字节 比较喜欢拷打项目,做这种烂大街项目一定要保证项目整体流程是说的出来的。其他的就暂时想不到了,希望大家都能找到自己喜欢的实习。  
大佬带我一个:时长很重要,实习生一个月工作22天,看规章制度熟悉业务五天,第一个月算17天,不懂的问导师,一个月时间导师口水讲***来句明天我要走了,导师二天就得踹开hr的门,问他招的什么人?以后不带人了啥的。我去了两个,不太敢问导师了,有的还得去百度搜,实在不懂直接复制粘贴,被导师直接问哪复制的,最后在教我改,这还是完整两个月水平
投递图森未来等公司9个岗位
0 点赞 评论 收藏
分享
2023-04-26 08:14
已编辑
北京大学 自然语言处理
     面试官上来先介绍了一下岗位,是做自动驾驶的中间件的,然后让我做了个自我介绍。问我能实习多久,问我研究生都学啥课程。我说了两门操作系统相关,开始了第一题。1.线程会有自己独立的栈区吗?会有独立的堆区吗?1.你了解 Linux 虚拟内存空间吗?2.虚拟内存有什么好处?3.两个进程 malloc 可能会返回一个值吗?会映射到一个物理地址吗?4.影响 C++ class 类的大小的因素有哪些?5.内存对齐会有影响吗?6.虚函数是怎么实现的?(具体咋问的不太记得了,反正是回答虚函数表底层)7.析构函数为什么有时候要是虚函数?8.用过智能指针吗?9.死锁产生的条件是什么?Cpp 中如何避免死锁?10.动态库和静态库有什么区别?11.map 和 unordered_map 有啥区别?12哈希表怎么处理碰撞问题?最差能退化到什么复杂度?13TCP 如何保证可靠?14 接 7  一个类空指针可以调用虚函数吗?可以调用普通函数吗?代码题 手写生产者消费者模型,我以前没看到过这种设计模式的内容,Cpp 相关库也不会。。。还以为是要自己写 mutex sem 的操作,最后面试官还问我这是原子操作吗,为什么不用 Cpp 的 mutex,我说不会。。。。。然后给我出了一道二叉树层序遍历,秒了。然后反问环节。先回忆这么多,还有的评论区再加。
投递小米集团等公司9个岗位 C++求职圈
0 点赞 评论 收藏
分享
2023-04-22 09:50
已编辑
北京大学 自然语言处理
小米面试官真的很好,题也不难,但是代码题真的太难受了,那么简单没写出来。上来 面试官先了解了一下实习的时间问题,问我能实习多久巴拉巴拉,然后说先写个代码题,省点后面的时间。代码题是输入一堆数,每个数都是出现 4 次,只有一个数出现三次。时间复杂度 Onlogn,空间复杂度 Ologn。真的很简单,就是手撕快排再遍历,我把时间复杂度一开始看成了 Ologn,所以想着用二分法,结果想着想着用了个 sort 排序。。。。最后没写出来,面试官问我,你都排序了直接遍历不就好了,我恍然大悟!!然后因此面经问的还比较多。1.std::move 的作用2.项目中 Cpp11 新特性用的多吗?11 新特性后 STL 有啥变化?举个例子,比如 vector 有啥新操作?3.Cpp 的锁 mutex 是怎么实现的?读锁,写锁,读写锁是什么?4.进程之间是怎么通信的,你知道哪些?介绍一下。5.你平常是了解网络 7 层还是 5 层协议?介绍一下传输层的协议。 6.介绍一下虚函数表还有不少,都忘记了。面试官人很好,还给我讲解我不会的点。最后问我还有没有投其他实习,我老是说了还有字节快手等面,他就说我们这主要是端到端开发,他们那是 xxxx(有点卡顿听不清,我还以为是想说方向不匹配要挂我),还问我有没有啥特别一定要做的方向,我说没有。最后我问他啥时候出结果,他说还有一面,要两个人看才行,然后问他啥时候二面,他说等联系。这是有还是没有二面呀。    
投递小米集团等公司9个岗位
0 点赞 评论 收藏
分享

创作者周榜

更多
关注他的用户也关注了:
牛客网
牛客网在线编程
牛客网题解
牛客企业服务