字节跳动 一面 算法岗。凉面(OC) 面经

问我的论文,我介绍了。
问我做没做项目,我说我还没做项目,我实习期间主要研究的是论文。
考了我两个编程题,不难,但是我都没完全做出来,因为不会用那个界面,平时都是只写主函数的。

--------------------
我一面竟然过了。看来字节也不是都面试八股文的,因为我看的面经都没用上。

--------------------字节二面
0)问了我论文什么时候发的,是在投还是发表,我给面试官打开了我文章录取的界面。

1)讲论文,面试官的问题比较仔细,虽然他不可能立刻了解我论文的算法,但是很会提问题,提的问题很深,这也许就是主管(教授)的强大吧。

2)问我会不会大模型。我说我不会。但是transformer会。然我我又引入到我的论文领域上来。(我感觉我要挂了,因为她说她们想要会大模型的人)

3)问了我会不会写代码,会java还是python。我说我刷了leetcode。没想到考了我手撕batchnorm。

4)你想做业务还是研究。

--------------------------------
我二面竟然也过了。
我发现一个事情,我也大概看了字节的其他专家的一些面经,我发现,字节现在趋向于项目经验了。

----------------------

OC
全部评论
其实,实习的话,要多多考虑,因为这里实习生太多了。
点赞 回复 分享
发布于 03-17 17:51 上海
学姐 问想做业务还是研究怎么回答的呀
点赞 回复 分享
发布于 03-09 16:31 湖北
昨天二面,今天还没消息不知道是不是凉了
点赞 回复 分享
发布于 03-05 23:45 浙江
接好运
点赞 回复 分享
发布于 03-05 10:42 北京
3月4日更新一下:我第一轮面试竟然过了..
点赞 回复 分享
发布于 03-04 14:12 上海
编程题怎么考的?
点赞 回复 分享
发布于 03-04 09:16 北京

相关推荐

✅一面1️⃣深挖多模态论文2️⃣介绍transformer架构3️⃣详细说一下Decoder的因果注意力 QKV分别来自哪4️⃣Attention为什么要做scaled 不做会怎么样 为什么用根号d_k5️⃣Transformer怎么做加速训练(KV缓存) 训练和推理有什么区别(并行化)6️⃣深挖多模态大模型论文用的video-llama 讲一下大模型的结构7️⃣论文用了CoT讲一下论文的CoT是怎么样的8️⃣微调用的LoRA介绍一下LoRA9️⃣LoRA初始化怎么做的,用的秩是多少,为什么不选其他的数1️⃣0️⃣知道deepspeed和megatron吗?分别介绍一下1️⃣1️⃣论文用的deepspeed详细讲了一下三个stage分别是什么✅二面1️⃣深挖多模态和大模型的论文2️⃣Decoder文本生成有哪几种方法3️⃣还知道哪些多模态大模型4️⃣介绍一下ALBEF、BLIP5️⃣BLIP2的结构是什么  两阶段怎么训练的 有哪些损失6️⃣知道PEFT吗 讲一下LoRA7️⃣还有什么微调方法 -> prefix-tuning和P-tuning 两者分别是怎么做的 为了解决什么提出的8️⃣后面就是一些场景题✅三面1️⃣深挖论文2️⃣讲一下multi-head attention 用pytorch手撕一下 要可以实现cross attention的3️⃣讲一下你用的大模型是什么结构 特征是怎么喂给大模型的4️⃣大模型训练为什么不用SFT5️⃣LoRA是什么?有什么好处6️⃣知道RLHF吗?讲一下训练流程7️⃣接下来就是好几个场景题,电商相关的,用大模型解决prompt应该怎么设计,怎么处理prompt的输出,怎么过滤错误格式的输出📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
字节跳动三面458人在聊 查看23道真题和解析
点赞 评论 收藏
分享
04-20 23:21
门头沟学院 Java
点赞 评论 收藏
分享
评论
7
8
分享

创作者周榜

更多
牛客网
牛客企业服务