找不到实习的大摆子

03-29 21:55 北京大学计算机类

关注

微软 bing LLM 应用面经

这次面的是工程院 bing 团队的 LLM 应用组，问的问题量不大，有一些比较开放性的问题比较有意思。
1.自我介绍两面都有
2. 主要会根据项目做一些介绍，这个一面久，二面短一些。
3. 一面问了 transformer 结构
4. 有没有做过大模型之外的 NLP 相关的内容（简单讲了讲）
二面的开放性问题
5. 做 rag 应用的时候，如果幻觉问题严重怎么办？比如已经给了很多 rag 召回的内容了，但是还是错误很多，尤其是一些时间数字类的信息，很容易不准确。（我回答：类似于指令微调，构造对应的数据集，微调强化大模型对检索的内容的跟随能力）
6.接着上面，那你觉得这种数据集怎么构造呢？检索的内容和问题很好弄，但是答案怎么获取方便？（我：我觉得可以反向构造，我先从网络上爬一堆内容作为答案，比如把新闻里的一些信息作为答案，然后让大模型比如 gpt4 生成对应的问题，再检索召回相关的内容，构造数据集。面试官说这个想法还挺有意思的）
7. 我想通过加噪声的方式提高模型的鲁棒性，你觉得这个噪声应该怎么加好？或者说怎么确定加在 token 的什么位置，加什么 token？（不太懂，我就说从我一般的理解，加噪声都是从 embedding 去加的，比如随机加一些高斯噪声提高鲁棒性）
8.如果我做 rag 召回的相关内容里，会有人恶意注入了一些错误的信息，你觉得会影响大模型的生成内容吗？怎么避免？（我认为肯定会有影响，因为关注的信息有错。我觉得可以提高召回的信息量，从而稀释错误信息占比来解决）
9.接着上面的回答，我们的输入长度有限制，不能无限加召回的内容怎么办？（可以在检索召回链路中再加一层，类似于粗排后再精排一次，从而减少错误信息的量）
其他的不记得了，就是感觉现在面试很喜欢问一些开放性问题。
代码题
一面编辑距离，二面是一个有序数组左边平移一定位置后的数组，找到一个 target 的下标。都不算难。

全部评论

推荐最新楼层

哈尔滨工业大学（深圳）计算机类

面了很多大模型暑期机会，面对一些开放性问答的时候感觉是最容易博得面试官好感的部分，大佬太强了！持续关注交流

1 回复

发布于 04-01 15:10 广东

门头沟学院计算机类

微软北京算是你校的大本营哈哈哈占比不小

1 回复

发布于 04-05 18:47 江西

滴滴

校招火热招聘中

官网直投

别开盒我吧

快手_MMU_算法实习生(实习员工)

问下大佬，微软哪里投呀

点赞回复

发布于 03-30 23:11 北京

自然语言处理

其实我觉得加噪声应该在数据集上就加，一种是人产生的噪声，这是有固定模式的；另一种，就是模型训练的本身的噪声了。

点赞回复

发布于 04-06 03:57 江西

石家庄市第一职业中专学校水产类

佬有拿到oc吗

点赞回复

发布于 04-06 21:31 北京

抬头吧相信爱你便能飞

哈尔滨工业大学（深圳）计算机类

想问下LLM应用这个方向招的公司多吗

点赞回复

发布于 04-15 22:18 广东

04-02 15:11

已编辑

门头沟学院计算机类

微软 AzurePaaS 二面

整个面试过程极简，35min，kpi自我介绍 3min介绍一个你觉得可以的项目 5min做题 20min：给你一个string，输出这个string+1（十进制）我做的是判断这个string是否为int/float，是就数位+1如果是其他的，就直接最后一个字符+1但是这里面试官我没考虑到哪些，我想到了没考虑到负数，面试官提示字符串溢出问题，我当时没想出来，后面一搜发现字符串竟然还分unsigned和signed，属实是扫盲了无符号 char (unsigned char): 可以表示的范围是从 0 到 255。有符号 char (signed char): 通常可以表示的范围是从 -128 到...

微软二面6人在聊软件开发2024笔面经

点赞评论收藏

转发

我也是找不到实习的摆子

04-16 12:33

已编辑

北京大学计算机类

【25暑期实习】美团大模型一面

女面试官态度蛮好的，起码比上一场百度的好10倍面试官先介绍组里的工作，自研大模型做客服自我介绍项目问答八股问的比较少位置编码llama设计上跟原始transformer的区别算法题：买卖股票问题2给了一个网店智能客服的场景，比如客户问衣服尺寸之类的问题，训练数据如何设计。问对什么方向感兴趣？了解RAG吗？RAG起到了什么作用，大致流程是怎样的？

点赞评论收藏

转发

04-23 16:52

电子科技大学电子信息类

腾讯音乐暑期实习 nlp 二面

1.问项目2.场景题+八股大模型幻觉问题怎么解决RAG模型的一些问题 怎么解决大模型微调用的什么框架？deepspeed的zero1 2 3llama的7b模型显存占用情况 参数量到显存占用如何换算？Lora的原理 为什么不在layernorm层也做lora？ embedding层能不能用lora？layernorm在训练和推理时有什么不同？3.问了一些个人的情况

点赞评论收藏

转发

04-12 14:52

已编辑

东北大学计算机类

百度 NLP算法实习二面 kpi面

全程25分钟，部门是百度文库策略部1.自我介绍2.介绍第一个项目，我的是一个RAG的项目，讲完他疯狂挑刺，然后我说了一些我们优化的一些点，他就说“你们这个地方做的挺粗糙的”，服了3.问问题，问我transformer的结构，我吟唱了一遍，然后他开始问一些里面比较偏的问题，有的答不出来就说一句“行吧行吧”我觉得我答不出来确实是我菜，多问一些拷打我我没问题，但是面试官也没必要这样搞人心态吧😭4.反问，我就说我没什么问题整体体验非常之差，面试官显得非常之没耐心，态度也很不好，感觉是kpi面；百度我之前一面就很难崩，没想到二面也这么难崩，xdm要是有面这个部门的记得面之前要做好心理建设 #算法#  #面试时最害怕被问到的问题#  #面试中的破防瞬间#  #简历被挂麻了，求建议#  #软件开发2024笔面经#

面试时最害怕被问到的问题面试中的破防瞬间

点赞评论收藏

转发

04-08 21:14

华东师范大学计算机类

阿里云一面面经——4.8

面试的是阿里云消息队列中间件团队，就是那个搞出RocketMQ的大佬团队。我个人主要做的是开发方向，对这种鸡架几乎一窍不通，能看得出来面试官很想问点我会的，但结果就是我几乎全程在对不起，我不知道。但不得不说阿里云这场面试的体验很好，很多我不会的面试官也一步步引导我，就当刷个经验了（而且我的学校不是23所，能有面试我已经很高兴了）。1.进程与线程之间的区别2.redis为什么快？（单线程处理计算密集型任务，reactor处理网络）3.ssh访问server的整个网络流程是怎样的？（我按照网络七层模型+socket+零拷贝+局域网+互联网这个流程说的）4.ssh怎么保证安全的？（仿照htt...

点赞评论收藏

转发

6 25 评论

全站热榜

正在热议

# 牛友的五一计划 #

20649次浏览 404人参与

# 晒一晒我的offer #

2839248次浏览 50024人参与

# 牛客帮帮团来啦！有问必答 #

405046次浏览 7867人参与

# 市场营销面经 #

1342次浏览 71人参与

# 非技术岗薪资爆料 #

9358次浏览 189人参与

# 产品实习，你更倾向大公司or小公司 #

31384次浏览 492人参与

# 如何看待offer收割机的行为 #

195318次浏览 2999人参与

# 第一次面试 #

18392次浏览 283人参与

# 2022届毕业生现状 #

285775次浏览 4103人参与

# 硬件人的春招flag #

14611次浏览 199人参与

# 浅聊一下我实习的辛苦费 #

71081次浏览 643人参与

# 华为求职进展汇总 #

443816次浏览 4449人参与

# 在国企工作的人，躺平了吗？ #

73219次浏览 887人参与

# 你更愿意参加线上面试还是线下面试？ #

7094次浏览 97人参与

# 女生做医疗销售有前景吗 #

3917次浏览 49人参与

# 简历中的项目经历要怎么写 #

382048次浏览 6406人参与

# 来聊聊机械薪资天花板是哪家 #

23284次浏览 180人参与

# 如何KTV领导 #

7585次浏览 74人参与

# 产品薪资爆料 #

28107次浏览 509人参与

# 聊聊这家公司值得去吗 #

64521次浏览 1307人参与

牛客网
牛客企业服务