找不到实习的大摆子

03-29 21:55 北京大学计算机类

关注

微软 bing LLM 应用面经

这次面的是工程院 bing 团队的 LLM 应用组，问的问题量不大，有一些比较开放性的问题比较有意思。
1.自我介绍两面都有
2. 主要会根据项目做一些介绍，这个一面久，二面短一些。
3. 一面问了 transformer 结构
4. 有没有做过大模型之外的 NLP 相关的内容（简单讲了讲）
二面的开放性问题
5. 做 rag 应用的时候，如果幻觉问题严重怎么办？比如已经给了很多 rag 召回的内容了，但是还是错误很多，尤其是一些时间数字类的信息，很容易不准确。（我回答：类似于指令微调，构造对应的数据集，微调强化大模型对检索的内容的跟随能力）
6.接着上面，那你觉得这种数据集怎么构造呢？检索的内容和问题很好弄，但是答案怎么获取方便？（我：我觉得可以反向构造，我先从网络上爬一堆内容作为答案，比如把新闻里的一些信息作为答案，然后让大模型比如 gpt4 生成对应的问题，再检索召回相关的内容，构造数据集。面试官说这个想法还挺有意思的）
7. 我想通过加噪声的方式提高模型的鲁棒性，你觉得这个噪声应该怎么加好？或者说怎么确定加在 token 的什么位置，加什么 token？（不太懂，我就说从我一般的理解，加噪声都是从 embedding 去加的，比如随机加一些高斯噪声提高鲁棒性）
8.如果我做 rag 召回的相关内容里，会有人恶意注入了一些错误的信息，你觉得会影响大模型的生成内容吗？怎么避免？（我认为肯定会有影响，因为关注的信息有错。我觉得可以提高召回的信息量，从而稀释错误信息占比来解决）
9.接着上面的回答，我们的输入长度有限制，不能无限加召回的内容怎么办？（可以在检索召回链路中再加一层，类似于粗排后再精排一次，从而减少错误信息的量）
其他的不记得了，就是感觉现在面试很喜欢问一些开放性问题。
代码题
一面编辑距离，二面是一个有序数组左边平移一定位置后的数组，找到一个 target 的下标。都不算难。

全部评论

推荐最新楼层

门头沟学院计算机类

微软北京算是你校的大本营哈哈哈占比不小

2

送花回复

发布于 04-05 18:47 江西

哈尔滨工业大学（深圳）计算机类

面了很多大模型暑期机会，面对一些开放性问答的时候感觉是最容易博得面试官好感的部分，大佬太强了！持续关注交流

1

送花回复

发布于 04-01 15:10 广东

网易互娱

校招火热招聘中

官网直投

别开盒我吧

快手_MMU_算法实习生(实习员工)

问下大佬，微软哪里投呀

点赞

送花回复

发布于 03-30 23:11 北京

自然语言处理

其实我觉得加噪声应该在数据集上就加，一种是人产生的噪声，这是有固定模式的；另一种，就是模型训练的本身的噪声了。

点赞

送花回复

发布于 04-06 03:57 江西

石家庄市第一职业中专学校水产类

佬有拿到oc吗

点赞

送花回复

发布于 04-06 21:31 北京

抬头吧相信爱你便能飞

哈尔滨工业大学（深圳）计算机类

想问下LLM应用这个方向招的公司多吗

点赞

送花回复

发布于 04-15 22:18 广东

04-21 21:54

已编辑

门头沟学院电子信息类

美团暑期实习 LLM (已offer)

个人背景可以看之前写的腾讯LLM面经一面/技术面 2024/3/13 晚上19:00-19:50先自我介绍，大概1分钟对大模型有什么看法和认识？说一个你比较熟悉的预训练大模型的结构和训练方式，我说了BERT介绍NeurIPS论文，中间穿插着一些提问，以往的模型怎么做的，输入输出，如何评估？数据集规模如何？介绍ICDM论文，中间穿插着一些提问，两篇论文大概花了半小时进行讲解介绍快手实习，主要做了些什么，中间问了XGBoost的原理，没回答上来。。。题外话，问我的CSDN和公众号等等是如何经营的算法题：搜索旋转排序数组(二分) + 岛屿数量(BFS)反问环节：美团大模型实习一般干些什么二面/技术面...

查看10道真题和解析

点赞评论收藏

转发

04-23 15:01

已编辑

门头沟学院计算机类

字节AML凉经

一面:1. 项目(MPS, 训练内存, 调度策略, 时分复用和空分复用)2. LLM推理有什么主要瓶颈3. LLM推理主要的优化技术4. page attention5. orca迭代级请求调度手撕: 反转链表二面: 1. 项目(MPS, GPU占用率指标)2. C++ 数组下标越界了会报什么错3. 怎么Debug, linux环境下如何定位错误手撕: LRU cache

查看9道真题和解析

点赞评论收藏

转发

05-07 21:57

已编辑

门头沟学院电子信息类

蚂蚁暑期实习多模态LLM (offer已拒)

个人背景可以看之前写的腾讯LLM面经一面/技术面 2024/4/7 晚上19:00-20:00没有自我介绍，直接让介绍一些工作介绍了NeurIPS论文介绍了ICDM论文问了本科的建模？这属实没想到。。。着重介绍了快手的实习，面试官说他之前也做过搜广推这块的，所以问得比较详细图与LLM结合这块了解多吗？说了一些现有的工作面试官说他们现在在做一些代码生成/理解的东西，问我对这块有没有什么理解和想法，开放性问答问我有没有上手过一些LLM的东西，我说了LoRA微调，让我说了下原理LoRA一般用在哪里？用在不同地方有什么区别吗来了一个新面试官，让我再用几句话总结一下快手的实习为什么你做的东西会有效果？简...

点赞评论收藏

转发

选钝角的芒果很热情

04-23 18:48

已编辑

中国人民解放军国防科技大学计算机类

好未来大模型面经

1. 自我介绍2. 项目，具体模块细节3. 手撕组合总和，且无重复4. 解码策略，比如贪心算法、随机采样等，鼠鼠没答出来 5. T5模型和Bert区别（项目有用T5模型）、self-attention6. 大模型RAG7.  llama具体结构8. RLHF技术9. 微调过大模型吗？讲一讲面试体验蛮好的已oc

查看9道真题和解析

点赞评论收藏

转发

05-13 11:15

已编辑

门头沟学院电子信息类

腾讯视频暑期实习自然语言处理/LLM (已offer)

个人背景学校情况：211本中九硕，本硕都是计算机科班，但研究方向并不是NLP，而是图表示学习，算是转行成功论文情况：2A1B均为一作，其中1A(NeurIPS)+1B(ICDM)已发表，另有1A刊在投；除此之外，还有一篇A会撰写中实习情况：一段快手推荐算法日常实习奖学金情况：本硕均拿了国家奖学金竞赛情况：菜鸡一枚一面/技术面 2024/3/28 晚上19:00-20:00自我介绍让讲两个拿手的东西，第一个介绍了NeurIPS那篇论文中间穿插着问了10多个问题，包括具体原理，数据集规模，下游任务等第二讲了快手的实习，主要干了些什么，中间穿插着10来个问题，面试官显然也了解GNN，因此这两部分耽误...

点赞评论收藏

转发

9 31 评论

全站热榜

正在热议

# 牛客帮帮团来啦！有问必答 #

820708次浏览 13027人参与

# 机械制造薪资爆料 #

319860次浏览 3732人参与

# 晒一晒我的offer #

3465637次浏览 55254人参与

# 0offer是寒冬太冷还是我太菜 #

427781次浏览 4940人参与

# 你觉得找工作该拿大厂还是小厂练手 #

61570次浏览 872人参与

# 荣耀求职进展汇总 #

70569次浏览 717人参与

# 如果可以选，你最想从事什么工作 #

185958次浏览 3076人参与

# 实习生应该准时下班吗 #

80725次浏览 592人参与

# 金三银四，你有感觉到吗 #

328981次浏览 4218人参与

# 海康威视求职进展汇总 #

101563次浏览 1216人参与

# 正在春招的你，也参与了去年秋招吗？ #

136426次浏览 1705人参与

# 实习必须要去大厂吗？ #

13819次浏览 219人参与

# 实习工作，你找得还顺利吗？ #

42375次浏览 469人参与

# 我在牛爱网找对象 #

49723次浏览 320人参与

# 软件开发投递记录 #

479045次浏览 7241人参与

# 宁德时代求职进展汇总 #

37033次浏览 413人参与

# 国企vs私企，你更想去？ #

20263次浏览 205人参与

# 求职遇到的搞笑事件 #

19662次浏览 287人参与

# 想实习转正，又想准备秋招，我该怎么办 #

117758次浏览 1327人参与

# 正在实习的你，有转正机会吗？ #

106385次浏览 1043人参与

牛客网
牛客企业服务