一面:
1. 自我介绍,讲论文和实习。
2. Transformer自注意力机制、位置编码、梯度消失/爆炸的解决方案。
3. 微调方法对比(Full Fine-tuning vs. LoRA/Adapter/P-Tuning)。
4. 推理加速技术(量化、动态批处理、FlashAttention)。
5. 如何优化大模型在长文本生成中的显存占用?
6. RLHF中奖励模型(RM)的训练数据如何构建?
7. 为网易云音乐设计一个AI歌词生成系统,如何提升创意性和押韵效果?
8. 模型剪枝/量化(GPTQ、AWQ)、服务化框架(FastAPI+vLLM)。
9. 如何解决大模型API服务的响应延迟问题?
一面八股挺多的,问的知识点也非常多,主要考察对大模型的理解,整体来说难度不算大,复习熟记八股应该都比较好答。

二面:
1. 自我介绍,讲论文和实习。
2. LayerNorm和BatchNorm在大模型中的区别?为什么Transformer用LayerNorm?
3. 解释大模型训练中的“灾难性遗忘”现象及解决方法。
4. 如果微调后的模型过拟合,你会如何调整?
5. 如何评估一个对话系统的生成质量?
6. 如何用大模型提升网易新闻的推荐效率?
7. 设计一个游戏内AI陪玩系统,需考虑哪些模块?
8. 领域适配时,如何构建高质量的垂域训练集?
9. 你在项目中如何解决数据稀缺问题?
10. 模型上线后遇到了什么性能瓶颈?如何优化的?
建议:精读《Attention Is All You Need》、HuggingFace文档。如果没有大模型项目,可用Kaggle/开源项目复现(如LangChain应用)。
全部评论

相关推荐

时间 2026_0228-19:00_百度(1h)1. 自我介绍2. 代码输出题---🅐 aaa - bbb 垂直高度计算<!doctype html><html lang="en"><head><meta charset="UTF-8" /><meta name="viewport" content="width=device-width, initial-scale=1.0" /><title>Document</title><style>p {font-size: 16px;line-height: 1;margin-top: 10px;margin-bottom: 15px;}</style></head><body><p>aaa</p><p></p><p></p><p></p><p>bbb</p></body></html>---🅑 对象方法 + this 指向const obj = {fn1() {const fn = () => {console.log(this);};fn();fn.apply(window);},fn2() {function fn() {console.log(this);}fn();fn.apply(window);},};obj.fn1();obj.fn2();---🅒 Promise + setTimeout 执行顺序new Promise((res, rej) => {console.log(1);setTimeout(() => {console.log(2);res("success");console.log(3);}, 0);}).then((res) => console.log(res));console.log(4);---🅓 作用域链const a = 10;function fn() {const a = 20;test();}function test() {console.log(a);}fn();---3. 第一道题结束问到是否了解BFC4. 讲一下事件循环5. 浏览器输入url发生了什么6. 讲讲回流和重绘7. 讲一下闭包8. 选一个自己项目中遇到的难题,怎么解决的讲一下9. 为什么项目要使用SSR?10. 平时怎么使用AI11. 怎么理解rules?12. 写一个类似于百度搜索页的页面(要求实现分页),共享屏幕(新建a.html的时候面试官说起一个工程来写,然后问可以用AI吗,面试官说什么都可以用,然后我打开了Gemini...)13. 新建工程的时候用了pnpm,问到为什么选择使用pnpm(提到幻影依赖)14. 产生幻影依赖的原理知道吗?15. 手撕:反转链表16. 反问了一些学习建议,说看一下掘金里面大佬分享的文章
查看15道真题和解析
点赞 评论 收藏
分享
1.请详细描述你在简历中提到的AI相关项目中,负责的主要模块和核心技术贡献。2.在设计一个高吞吐、低延迟的模型推理服务时,你会重点考虑哪些架构层面和工程层面的问题?3.请解释C++程序内存中栈(stack)、堆(heap)和静态/全局存储区的特点与主要区别。4.在C++中,new/delete`与'malloc/free`的主要区别是什么?为什么在C++中通常推荐使用前者?5.请解释深拷贝和浅拷贝的概念,并说明在什么情况下必须使用深拷贝。6.请阐述C++中'std:unique_ptr、'std..shared_ptr和'std:weak_ptr的设计意图、使用场景及相互区别。7.虚函数表(vtable)是如何实现运行时多态的?虚函数与纯虚函数(抽象类)在语义和用法上有何不同?8.什么是内存对齐?编译器对结构体进行内存对齐的主要规则是什么?请计算一个给定结构体(包含不同类型成员)在特定平台下的sizeof大小。9.请解释C++11中右值引用(&&)和移动语义(move semantics)的概念,并说明它们如何用于实现高效的数据转移(如std.:.vector的push_back)。110.简述CUDA的SlIMT(单指令多线程)编程模型,描述thread、block、grid的层次关系。11.在CUDA内核中,一个线程的局部变量通常存储在何处?这与寄存器的分配有何关系?12.在CUDA优化中,如何使用共享内存(Shared Memory)来减少对全局内存的重复访问?请举一个简单的例子(如矩阵乘法中的分块)。13.什么是warp shuffle指令?它在warp内部的数据交换和规约操作中有什么优势?14.解释在CUDA中使用float4或int4等向量化加载/存储指令进行合并访存的原理和性能收益。15.什么是共享内存的bankconflict?它是如何产生的?请举例说明。16.如何通过数据填充(padding)或其他内存布局调整技术来避免或减轻共享内存访问中的bankconflict?17.解释CPU缓存的工作原理,包括时间局部性、空间局部性的概念,以及常见的缓存替换策略18.编程题:实现一个算法,在一个包含大量整数的数据流中,实时找出出现频率最高的前K个元素。请描述你的思路(哈希表+最小堆)并分析时间复杂度。
查看18道真题和解析
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务