网易大模型应用岗(已offer)

一面:
1. 自我介绍,讲论文和实习。
2. Transformer自注意力机制、位置编码、梯度消失/爆炸的解决方案。
3. 微调方法对比(Full Fine-tuning vs. LoRA/Adapter/P-Tuning)。
4. 推理加速技术(量化、动态批处理、FlashAttention)。
5. 如何优化大模型在长文本生成中的显存占用?
6. RLHF中奖励模型(RM)的训练数据如何构建?
7. 为网易云音乐设计一个AI歌词生成系统,如何提升创意性和押韵效果?
8. 模型剪枝/量化(GPTQ、AWQ)、服务化框架(FastAPI+vLLM)。
9. 如何解决大模型API服务的响应延迟问题?
 一面八股挺多的,问的知识点也非常多,主要考察对大模型的理解,整体来说难度不算大,复习熟记八股应该都比较好答。

 二面:
1. 自我介绍,讲论文和实习。
2. LayerNorm和BatchNorm在大模型中的区别?为什么Transformer用LayerNorm?
3. 解释大模型训练中的“灾难性遗忘”现象及解决方法。
4. 如果微调后的模型过拟合,你会如何调整?
5. 如何评估一个对话系统的生成质量?
6. 如何用大模型提升网易新闻的推荐效率?
7. 设计一个游戏内AI陪玩系统,需考虑哪些模块?
8. 领域适配时,如何构建高质量的垂域训练集?
9. 你在项目中如何解决数据稀缺问题?
10. 模型上线后遇到了什么性能瓶颈?如何优化的?
建议:精读《Attention Is All You Need》、HuggingFace文档。如果没有大模型项目,可用Kaggle/开源项目复现(如LangChain应用)。 #AI面试问题分享#
全部评论
没有考算法题吗?
点赞 回复 分享
发布于 今天 01:10 河南

相关推荐

03-03 21:03
门头沟学院 Java
面试强度爆炸,目测二面已挂,发出来助牛友们渡劫1.开局问,看你对AI这个方向比较感兴趣,公司的业务可能不是你喜欢的,你也要做吗2.看你在去年拿了两个国奖,一个互联网加一个挑战杯,能讲讲做了什么吗?(忘完了,直接寄了)3.拷打刚说的项目,但是简历上没有4.实习为什么离职?5.目标检测模型的输入?(比赛项目)6.你知道计算机中4个bit表示的数据范围是多少吗?7.怎么算出来的?8.其实现在很多的计算机都有多核CPU,那假设啊,我在一个单核的机器上跑多线程任务,和在多核机器上一个线程分配一个核心去单线程的跑,哪一个效率会更高?或者说在单核上去跑多线程,效率能得到提升吗?9.有哪些情况能得到提升,还是所有的情况都会得到下降?10.参加比赛的项目应该是很多人协同开发的对吧,用的git,一个在本地已经commit但是没有push的记录,怎么撤回?11.假设有一个小游戏去开发,需要你实现一个小游戏的榜单,前一百去展示,怎么去做?12.对于两个分数相同的,你觉得怎么算,我们只要前一百,如果有102个得分都是100分怎么办13.你说加时间戳,你觉得时间戳加在哪里?更细一些?14.用zest查找分数的时间复杂度?查找排名的时间复杂度是多少?跳表的时间复杂度是多少?15.知道traceId吗,是做什么的?你知道这个id是怎么生成的吗?16.这个traceId是怎么传递的?你说用ThreadLocal,那如果是多个系统之间的呢?17.Linux的常见命令熟悉吗?18.假设说有一个文件,里边每一行是一行数据,这一行数据是一个ip,我需要你用linux命令,找到这个文件中出现频率最高的10个ip,你会怎么去找?19.那你觉得用java程序应该怎么去写?20.就比如你这个面试的链接,打开之后应该是正常的进入一个页面,但是如果打开之后,你进入页面,提示说找不到服务器的ip地址,你会怎么去排查这个问题?21.日常生活中会遇到这种红绿灯,假设要让你写一个软件,控制红绿灯,你觉得哪些地方的设计比较重要?反问有没有一些建议,可能是因为实习的比较多,经常需要有新的东西了解,基础可能没有很注意,项目的一些细节可能也没有去仔细的去看,可以深入去看一看,另外因为看了一面的面评,可能对自己的期望抬得比较高,有一些问题其实自己也没有答的特别好(其实是很多问题都不会,手都快扣烂了)直接道心破碎,已回去沉淀计算机基础
查看21道真题和解析
点赞 评论 收藏
分享
评论
点赞
7
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务