04-28 09:07 百度_NLP算法(实习员工)

发布于山西

关注

4.24滴滴大模型算法一面面经

1. 自我介绍
2. 过一下你觉得最好的项目/实习。说了一个教程类开源项目，其中包括部署、LoRA微调等内容。又说了了另一个在学校做的项目，问的很细，包括我们使用Function Call做检索的流程、用langchain如何实现的，内部原理是什么。
3. 下一个项目BERT相关的，问了问Transformer的原理结构，他的优点是什么，我讲的是他是不限制距离计算，有效遏制了经典RNN模型的长序列遗忘问题。问了问BERT的原理，幸好看过原论文，简单说了下。
4. 下一个项目是做的Qwen SFT，训练数据如何生成的，多少数据，训练的参数，训了多久。
5. 问了强化学习deepseek，我答了GRPO和PPO，问了DPO我没看过。
6. medium题

全部评论

推荐最新楼层

牛客384563374号

开源项目经验加分

1 回复分享

发布于 05-03 17:40 广东

拒绝内卷的安哥拉兔很有一套

暨南大学人工智能

佬，开源项目可以分享一下吗

点赞回复分享

发布于 05-13 11:46 广东

牛客650834652号

湖南大学算法工程师

方便问问佬bg吗

点赞回复分享

发布于 04-29 14:03 浙江

牛客193865349号

电子科技大学算法工程师

求问是哪个部门啊

点赞回复分享

发布于 04-28 13:53 四川

顶呱呱的高级磨洋工很完美

Université PSL 法语翻译

佬，可以问一下是哪个部门吗，我们的问题好相似

点赞回复分享

发布于 04-28 09:21 浙江

05-15 12:49

已编辑

上海华东师范大学算法工程师

蚂蚁网银 NLP算法面经

4.21 投简历4.23 约后天一面4.25 一面无手撕，上来先拷打论文，其中有个地方用了rag，面试官问我这里是怎么把文本转换成向量储存的。(我以为是问我工程上的实现，这是去年做的一个小模块，回忆了半天细节，答得支支吾吾，面完了之后结合下一个问我才意识到其实是问我embedding过程)看我支支吾吾就直接问transformer是怎么把token处理成向量的。transformer的self-attention和cross self-attention区别在哪里。pre-norm和post-norm的区别？进一步，为什么现在主流大模型都用post-norm。lora的实现过程。大模型用的Lo...

查看10道真题和解析实习进度记录

点赞评论收藏

分享

05-08 17:04

已编辑

浙江大学算法工程师

字节-tac-面经-算法-大模型-搜推（持续记录）

面试问题：- （针对简历提问）你工作里主要关注哪些指标？解释一下AUC含义、计算和作用- 主流的开源大模型结构有哪些？（prefix decoder，casual decoder、encoder-decoder）- 介绍一下layernorm和batchnorm的区别？- 在机器学习里，怎么处理长尾数据和多峰数据？- 怎么解决模型的冷启动问题，你觉得LLM在冷启动方面能够起到什么作用？- 介绍一下常见的优化算法（SGD ->Adagrad ->RMSProp ->Adam -> AdamW）？优缺点- 为什么Adam不一定最优而SGD最优的？怎么理解分析？- （针对简历提问）你工作里的对比损失是怎么构造的，有什么作用？介绍常见的对比损失的公式。代码题：- 数组第K大。给定整数数组 nums 和整数 k，请返回数组中第 k 个最大的元素。（力扣215原题）- 手写对比损失的计算（结合项目），并简单说了一下原理。（大概写出来就好）二面我这个是交叉面，提问的有部分设计大模型，也当然我简历上有大模型，所以问了一些llm+搜推的内容，但这部分交叉问题比较浅，能说个大概就很好，同时也有很多经典的机器学习面经问题。因为项目里提到了对标学习，所以面试官在代码考核部分让我写个示例，所以写进简历的一定要准备好（包括流程步骤，代码实现大概要清楚）。面广告算法的岗位，机器学习面经暴率很高，建议熟背，就算是看过有印象，问到的时候也会基本很稳。#面试问题记录#

字节跳动二面484人在聊

查看10道真题和解析面试问题记录

点赞评论收藏

分享

04-21 21:07

门头沟学院算法工程师

美团暑期实习大模型二面

鼠鼠急性咽炎好几天了，下午还发39度高烧，本来想联系换时间的，但考虑现在hc基本发完了，再延期不知道会不会影响，去校医室开了点退烧药手撕：hot100 层序遍历，秒了说下复杂度聊项目，跟面试官讲了项目背景、遇到的难点，中间面试官会打断提问题之后面试官对整体的训练流程比较质疑，问CPT后为什么需要sft？跟CPT的区别是什么，我解释了好几次，从训练目的、数据差异等角度都解释了，但面试官还是没明白，让我写下两者的loss，从loss的角度去解释，我就写了个基于上下文去预测next token的交叉熵，然后解释说无论是pt还是sft，loss都是交叉熵，区别在于给定的上下文，或者数据不同，结果面试官...

查看7道真题和解析

点赞评论收藏

分享

05-07 15:29

已编辑

北京航空航天大学算法工程师

整理下近期的大模型日常实习面经

投票

字节一面：上来先笔试1.拷打项目2.MoE3.有没有微调经验，如何微调，介绍原理4.RAG5.AI agent6.functioncall感觉拿我刷kpi了😭也可能是我没大厂实习的原因字节一面寄百度一面：1.拷打项目2.Blip和blip2区别3.clip怎么训练的4.chatglm的创新点是什么5.transformer八股6.拷打项目的sam模型7.笔试：开根数（本人没准备笔试，用的梯度下降，被狠狠羞辱后想起二分）百度一面过快手一面：1.拷打项目2.拷打blip2和clip3.问了下clip 和blip的一些损失函数4.拷打transformer5.多模态如何融合的6.拷打原生大模型7.退火笔试：最小覆盖子串快手一面过百度二面：和一面基本问题差不多，又格外拷打了vit的一些维度问题，和处理问题笔试：三数和百度二面过发了口头offer，经过对比后拒了，all in 快手快手二面：问的情景题：如何做视频相关大模型的应用，然后依旧拷打项目，感觉快手面试官人都不错。笔试：链表删除右节点快手二面过快手hr面：问了问入职时间，和一些基本信息，一共才面了10分钟左右，给我有点慌，不会日常实习给我hr面挂了吧😭😭😭😭。我已经很牛马了😭更新，老铁厂oc了~第一份实习，太难了😭 #实习进度记录#  #面经#  #快手#  #百度#

查看29道真题和解析实习进度记录

点赞评论收藏

分享

05-09 17:23

华北电力大学（北京） Java

面试字节大模型（LLMs）RAG面被问麻了~

LORA 原理：解释 LORA(Low-RankAdaptation)的核心思想，如何通过低秩矩阵实现参数高效微调?数学形式如何表达?Self-Attention机制：自注意力机制中 O/K/ 矩阵的作用是什么?如何通过缩放点积计算注意力权重?公式推导并解释Softmax 的意义。位置编码：Transformer为何需要位置编码?主流 LLM(如 LLaMA、GPT)使用哪种位置编码(如 ROPE)?相比绝对/相对位置编码有何优势?Seq2Seg 模型：Seq2Seq模型的核心组件是什么?Encoder-Decoder结构如何解决长程依赖问题?RAG技术：RAG(检索增强生成)的完整链路包含哪...

查看9道真题和解析

点赞评论收藏

分享

评论

4

24

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 牛油的搬砖plog #

21797次浏览 99人参与

# 为什么那么多公司毁约 #

162394次浏览 1211人参与

# 一人一个landing小技巧 #

20482次浏览 397人参与

# 我在牛爱网找对象 #

177092次浏览 1325人参与

# 520告白墙 #

14410次浏览 257人参与

# 找工作的破防时刻 #

22368次浏览 349人参与

# 腾讯音乐求职进展汇总 #

85841次浏览 480人参与

# 25届秋招公司红黑榜 #

259126次浏览 1087人参与

# 实习学不到东西怎么办？ #

202657次浏览 2105人参与

# 高学历就一定能找到好工作吗？ #

46347次浏览 579人参与

# 哪些企业的面试体验感最差？ #

23760次浏览 231人参与

# 机械人，说说你的烦心事 #

64874次浏览 825人参与

# 你会为了工作牺牲生活吗？ #

35061次浏览 287人参与

# 机械应届生薪资要多少才合适？ #

21309次浏览 90人参与

# 入职以后才知道的校招谎言 #

80194次浏览 542人参与

# 运营人的第一份offer应该如何选 #

141565次浏览 1084人参与

# 机械制造岗投递时间线 #

21808次浏览 339人参与

# 运营面经 #

106921次浏览 1210人参与

# 拼多多工作体验 #

21969次浏览 156人参与

# 工作中，你有没有遇到非常爱骂人的领导？ #

28245次浏览 155人参与

牛客网
牛客企业服务