找不到实习的大摆子 level
获赞
374
粉丝
241
关注
0
看过 TA
4924
北京大学
2025
C++
IP属地:北京
暂未填写个人简介
私信
关注
被拷打了一个半小时, 感觉也寄了。1.自我介绍2. 针对字节的实习,问我 flask 和 go 的 gin 框架的体验和区别(我黑人问号,以为走错了,不记得了,随便说了几句。3.你熟悉 C++,说一下堆和栈的区别4.数据结构中堆栈队列介绍一下。5. 拷打第二份实习大模型的具体内容, 主要还是我介绍。6. 你知道预训练的一些并行方式吗?(说没接触过预训练, 大概讲了一下知道的两种常用并行,就是数据并行和模型并行解释了一下)7.你知道预训练的数据应该怎么预处理吗?(没懂,我说针对质量进行过滤吧?8.换句话说, 如果我不需要对所有的数据都训练,只需要对每一部分有权重的取数据怎么做?(我:最暴力的方法就是每一块都按比重选一定数量再用于训练)你这个是离线方式,我在线想要调试各种方式怎么做?(我:随机数然后映射到对应的数据去随机取?)9.你知道 Llama 用了多少 token 数据训练吗?(我 这真没记)10. 你知道 flask attention 吗?(没用过,不知道原理,只知道这个东西存在。。11.那你知道 flask attention 能有多大的性能提升吗? 不知道12. 你知道最早的 attention 做机器翻译,它的注意力怎么得的吗?(不记得,瞎说一通)13. 这个 attention 和 self attention 的 QKV 怎么来的?(attention 应该是初始化的吧?巴拉巴拉瞎说14. 有了解过最近那些超长文本大模型的预训练吗?(没有了解具体原理,但是应该就是加大数据训练长度, 用外推更好的位置嵌入吧?)15. 你说到外推性,那你了解常见的提高外推能力的方式吗?(主要还是位置编码吧? 给他讲解了一下 ALIBI 这个方式)16 讲一下你对旋转位置编码的理解。17 位置和注意力分数的曲线是什么样子的呢?(一条向上的抛物线,位置越远注意力越小)18. 这个曲线会不会和三角函数一样呢?(我觉得如果是用 Transformer 原本的位置嵌入可能会吧。。。。其他的应该不会?)19 回到我们刚刚说的数据处理, 你能不能用代码实现一下看看?(自己电脑没装 Python  pytorch,就用 Cpp 写,简单写了个逻辑, 随机数有点问题,也跑不通,大概说了一下方式)在写个反转链表反问:
0 点赞 评论 收藏
转发
1. 自我介绍2.做算法题两个整数,修改二进制位使得二者相同要多少次修改?给两个不限制大小的数字,求乘法。三数之和,求最接近 target 的和。代码题写的很差,给了 45 分钟,第一个题只考虑了正整数。。用了异或,第二个题没理解清楚,用了 int 64, 是给 string。 第三个题双指针没啥难度。最后写了一道半, 面试官给我时间重写第二题和第一题,也没改完,就讲了一下思路。3. 拷打字节实习内容(汗流浃背)4. 稍微问了一下蚂蚁的算法实习内容5. 介绍一下虚拟内存6.直接 new 一个 1GB 大小的数组怎么实现的, 还是说虚拟地址7.不用虚拟地址,只用物理地址不可以吗?8. 两个线程可以同时读写一个文件吗?可以同时读吗?不会出现读一半的情况吗?9.拷打 webserver 项目。为什么用 epoll, proactor 和 reactor 有啥区别?双链表实现心跳机制是什么?介绍一下。 用 vector 不行吗?10.看到你简历说熟悉 TCP 协议, 为什么 TCP 要三次握手,两次不行吗?反问:对我的评价:代码题不理解要及时问, 基础还可以, 但是字节的实习体现了工作量,没体现技术难点。有没有后续: 不能保证, 只能往上反馈结果, 如果有下一轮面试可能快的话这周,慢的话两周。
0 点赞 评论 收藏
转发
第一次面大模型的面试, 八股真的是背了也忘, 汗流浃背。1. 自我介绍2. LLAMA 的结构有什么特点?(第一个就汗流浃背, 不知道从哪方面入手说。 我是说 casual lm 的 mask,only decoder, 说 pre layer norm, 说激活函数也不是 relu)2.由上引发的题, 讲一下 LLAMA 的 layer norm, 我忘记 llama 是 pre rms norm 了,一直没说出来。面试官就想问这个。3. 讲一下 LLAMA 的激活函数吧。 汗流浃背,就知道是 swiGLU。 我就说那个 swish 函数为头的门控线型单元吧啦吧啦的,说的结结巴巴。公式也没记住。4. 详细介绍一下 Transformer 的结构。(在 encoder 输入给 decoder 的 K V 我说成了 Q V,然后就说我也记不清是 K 还是 Q 了。。。)5. 为什么计算注意力 QK 分数要除以维度开根号?为什么不能直接除以维度?(就瞎扯容易数据太小, 收敛太慢巴拉巴拉。。。)6.讲一下你对  位置嵌入的了解。(绝对位置相对位置一顿输出)7. 说一下你知道的 tokenizer 的分词办法。(详细说了 bpe, wordpiece 和 unigram 都记不得了,连这两个名词我都说不清)算法题一个, 岛屿数量。
0 点赞 评论 收藏
转发
emm 腾讯加班看起来真严重,假期晚上还约面试。假期前接到电话约面,但是是上海腾讯,我在北京,然后面试官说具体啥时候能到后面二面三面再跟他 leader 说(我心想不会是实习生来面试吧),反正约面试试。上来先让我自我介绍,然后说了一下他们组是干什么的,最后我反问也是问这个,他们组是 IEG 的游戏数据处理的客户端前端开发,不是很懂。1.你这个 webserver 能介绍一下吗?(途中提问了几个简单问题,比如工作线程做什么内容,是怎么被 HTTP 请求唤醒的,感觉问得很简单。。。)2.智能指针的 shared unique ptr 的区别是什么?在什么场景下使用?(什么比场景这块我还真没太注意,就随便说了多线程用 shared ,也不知道是不是对的)3.C++11 的移动语意你了解吗?(我就介绍了右值引用,move 啥的)移动有什么优势吗?4.进程和线程有什么区别?你刚提到了进程的虚拟地址空间,能仔细说一下有哪些部分吗?5.你在写 C++的时候,会有哪些常见的问题导致崩溃?(回答应该是野指针、地址越界、内存泄漏这样的)6.常见的数据结构有哪些?就拿树来说,B 树和 B+树有什么区别?B+树经常被应用在什么地方?树有哪些遍历方式(我听成了二叉树,说了四种,但是好像问题不大)。可以给我描述一下如何实现层序遍历吗?不用代码实现。7.进程间通信有哪几种方式?(我回答完问他要不要解释一下,他说时间比较久了,就不用了)然后最后问我就是可能要做一些 IOS 或者安卓客户端,介不介意其他语言。然后就是反问阶段。面试官最后说会和他 leader 评估后,有结果大概节后联系。面试官非常有礼貌,但是感觉像 KPI 面。因为他知道我大概率不会去上海,而且问的都不深入,也没有手撕代码。 #面经#   #腾讯#
投递腾讯等公司10个岗位
0 点赞 评论 收藏
转发
从 16 号投简历到今天拿字节 offer 是 12 天,在五一前最后一个工作日结束流程也算是让我能过个好假。想总结一下我个人认为应该注意的项,小米和字节的面经之前都发在动态里了,有兴趣的可以看看。1.面试官非常在意实习时长。我从一面开始就和面试官说我想深入了解项目,会实习的比较久。HR 面实际上就是看你实习多久,HR 会和面试的面试官提前交流,所以能在技术面中就透露出自己实习时长久会比较好。HR 面真的有挂人的,被挂很多都是因为被 HR认为实习时间可能不长(比如说出想刷多段大厂实习经历这种观点)。我个人认为段数并不重要,质量可能更重要一些。2.运气大于努力,有 HC 的时候什么都好说。字节两面技术面就结束,第二年问的技术内容也不多,并且从周三一面到周五 HR 面拿 offer,我认为是他们缺人,希望五一前定下来,早点入职。所以在当前阶段,日常实习 HC 整体比较少(给我面试的大厂实际上非常少),找不到实习不是自己水平问题,更可能是时间节点不好,不要妄自菲薄。3.一直没有面试可以换个方向试试。我投腾讯后台十天无人问津,转岗冷门方向后第二天被捞面试。所以要海投,不仅是公司海投,岗位也要海。4.一个合适的内推还是比较重要的。字节找学长内推同一个部门,当天就过筛简历了。而直到今天,网易才刚过了我两个岗位初筛,京东滴滴 momenta 初筛都没筛。。。百度图森还挂简历。5.Cpp 相对比较重基础,像虚函数表、move 和智能指针,基本上大小厂轮轮面。Cpp primer 我觉得很有必要看。6.项目不怕烂大街,怕学的不深入。我做的 webserver 够烂大街了,还只实现了 GET。面试官照样愿意问,每次自我介绍我都会说做了一个非常经典的服务器项目,也学习到了很多。字节 比较喜欢拷打项目,做这种烂大街项目一定要保证项目整体流程是说的出来的。其他的就暂时想不到了,希望大家都能找到自己喜欢的实习。 #面经#
投递图森未来等公司10个岗位
0 点赞 评论 收藏
转发
#软件开发2023笔面经#  #小米#  #23届找工作求助阵地# 面试官上来先介绍了一下岗位,是做自动驾驶的中间件的,然后让我做了个自我介绍。问我能实习多久,问我研究生都学啥课程。我说了两门操作系统相关,开始了第一题。1.线程会有自己独立的栈区吗?会有独立的堆区吗?1.你了解 Linux 虚拟内存空间吗?2.虚拟内存有什么好处?3.两个进程 malloc 可能会返回一个值吗?会映射到一个物理地址吗?4.影响 C++ class 类的大小的因素有哪些?5.内存对齐会有影响吗?6.虚函数是怎么实现的?(具体咋问的不太记得了,反正是回答虚函数表底层)7.析构函数为什么有时候要是虚函数?8.用过智能指针吗?9.死锁产生的条件是什么?Cpp 中如何避免死锁?10.动态库和静态库有什么区别?11.map 和 unordered_map 有啥区别?12哈希表怎么处理碰撞问题?最差能退化到什么复杂度?13TCP 如何保证可靠?14 接 7  一个类空指针可以调用虚函数吗?可以调用普通函数吗?代码题 手写生产者消费者模型,我以前没看到过这种设计模式的内容,Cpp 相关库也不会。。。还以为是要自己写 mutex sem 的操作,最后面试官还问我这是原子操作吗,为什么不用 Cpp 的 mutex,我说不会。。。。。然后给我出了一道二叉树层序遍历,秒了。然后反问环节。先回忆这么多,还有的评论区再加。
投递小米集团等公司10个岗位 C++求职圈
0 点赞 评论 收藏
转发
#面经# 小米面试官真的很好,题也不难,但是代码题真的太难受了,那么简单没写出来。上来 面试官先了解了一下实习的时间问题,问我能实习多久巴拉巴拉,然后说先写个代码题,省点后面的时间。代码题是输入一堆数,每个数都是出现 4 次,只有一个数出现三次。时间复杂度 Onlogn,空间复杂度 Ologn。真的很简单,就是手撕快排再遍历,我把时间复杂度一开始看成了 Ologn,所以想着用二分法,结果想着想着用了个 sort 排序。。。。最后没写出来,面试官问我,你都排序了直接遍历不就好了,我恍然大悟!!然后因此面经问的还比较多。1.std::move 的作用2.项目中 Cpp11 新特性用的多吗?11 新特性后 STL 有啥变化?举个例子,比如 vector 有啥新操作?3.Cpp 的锁 mutex 是怎么实现的?读锁,写锁,读写锁是什么?4.进程之间是怎么通信的,你知道哪些?介绍一下。5.你平常是了解网络 7 层还是 5 层协议?介绍一下传输层的协议。 6.介绍一下虚函数表还有不少,都忘记了。面试官人很好,还给我讲解我不会的点。最后问我还有没有投其他实习,我老是说了还有字节快手等面,他就说我们这主要是端到端开发,他们那是 xxxx(有点卡顿听不清,我还以为是想说方向不匹配要挂我),还问我有没有啥特别一定要做的方向,我说没有。最后我问他啥时候出结果,他说还有一面,要两个人看才行,然后问他啥时候二面,他说等联系。这是有还是没有二面呀。  #小米#  #软件开发2023笔面经#
投递小米集团等公司10个岗位
0 点赞 评论 收藏
转发
牛客网
牛客企业服务