首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
大厂算法Offer情报官
06-04 15:31
门头沟学院 算法工程师
发布于天津
关注
已关注
取消关注
大模型面经每日总结
#面经#
#大模型#
#量化#
网易大模型量化面经
0.常见的量化方法有哪些?
原理及适用场景,并分析它们在计算复杂度和精度损失上的差异
1.PTQ 和 QAT 咋选?
2.低比特量化在智能音箱能用吗?
3.语音识别量化有啥难题和办法?
4.模型量化和其他压缩技术配合经验
5.QAT中,量化噪声模拟的作用是什么?
6.在多头注意力机制 前馈神经网络 ,量化策略有何不同?
7.针对 ARM 架构的芯片 如何优化量化模型的推理速度?
全部评论
推荐
最新
楼层
暂无评论,快来抢首评~
相关推荐
06-03 19:25
已编辑
门头沟学院 Java
大模型面经 (第二期)
上期写道刚开始面试的时候,这期写一写5月11号时候,这个时候手上就已经有两三家offer了,然后去北京的前一两天又发了三家offer随便选了个离公司近的工资高点的就去了。那么这期还是讲一下怎么去面试。其实面试的东西都一样,就是说你干过什么,回答问题就行了你要考虑的,不是这么去背八股文,而是要去琢磨到底要不要去实习,我个人而言,我最开始是因为电脑配置带不动才去好点的公司有好的卡给我用,然后呢去了也有工资,但是我的自由被限制了,我没法再天天琢磨新玩意我很痛苦,然后学会了怎么摸鱼,人家都是9点半来,我一开始是8点40到,我现在就吃了早饭再去差不多9点能到(就尽力偷懒还是最勤奋的那一批,因为人家都是老...
查看13道真题和解析
牛客激励计划
面试问题记录
点赞
评论
收藏
分享
06-06 09:56
门头沟学院 算法工程师
大模型面经每日总结 (京东大模型实习)
1. 基础概念题:什么是大模型核心加速技术中的 “算子融合”?举例说明其作用。答案要点:算子融合是将多个连续计算算子合并为一个,减少计算图中的节点数和显存读写次数,降低延迟。举例:如将 Transformer 中的 Add(残差连接)与 RMSNorm(归一化)融合,减少两次内存访问,提升推理速度。2. 技术原理题:Flash Attention V2 如何优化注意力计算效率?与 V1 的核心区别是什么?答案要点:• V1:通过分块计算注意力,减少显存占用(避免存储所有中间键值对)。• V2:引入 “内外循环交换策略”,将矩阵乘法的循环顺序调整为更适合 GPU 并行计算的模式,进一步提升计算效率,尤其在长序列场景下加速明显。3. 量化技术中,FP8、INT4 AWQ、INT4-FP8 AWQ 的适用场景和压缩率有何差异?4. RAG 系统中,文档切分粒度如何影响检索和生成效果?实际中如何确定最优粒度?5.在长序列推理场景中,PagedAttention 和 Prefix Caching 分别解决什么问题?如何配合使用?答案要点:• PagedAttention:将 KV Cache 分块存储在非连续显存中,避免显存碎片,支持处理超长序列(如百万 Token);• Prefix Caching:缓存历史对话的 KV 对,跨请求复用,减少重复计算(如多轮对话中复用上文缓存)。配合逻辑:PagedAttention 解决显存限制,Prefix Caching 减少计算量,两者结合可提升长对话场景的效率和稳定性。6. 在企业级推理场景中,如何根据需求选择量化方案?举例说明短文本高并发和长文本场景的优化策略。实时客服系统用 INT4 量化加速响应;金融报告生成场景用 FP8+PagedAttention 处理数千 Token 输入。
点赞
评论
收藏
分享
06-04 16:38
郑州大学 算法工程师
面试字节大模型(LLMs)RAG面被问麻了~
LORA 原理:解释 LORA(Low-RankAdaptation)的核心思想,如何通过低秩矩阵实现参数高效微调?数学形式如何表达?Self-Attention机制:自注意力机制中 O/K/ 矩阵的作用是什么?如何通过缩放点积计算注意力权重?公式推导并解释Softmax 的意义。位置编码:Transformer为何需要位置编码?主流 LLM(如 LLaMA、GPT)使用哪种位置编码(如 ROPE)?相比绝对/相对位置编码有何优势?Seq2Seg 模型:Seq2Seq模型的核心组件是什么?Encoder-Decoder结构如何解决长程依赖问题?RAG技术:RAG(检索增强生成)的完整链路包含哪...
点赞
评论
收藏
分享
05-28 20:13
中山大学 算法工程师
强度拉满:网易大模型算法岗
1️⃣一面时间:9.12 时长:1hcode:统计岛屿数量、最大岛屿面积,DFS方法解了然后介绍实习项目,面试官非常耐心地听,没有打断八股1.bert和gpt的区别?(从模型架构、训练方式、使用场景方面回答的)2.训练/微调一个LLM的流程?3.实习时用的 megatron 框架吗,对分布式训练框架了解多少?(回答了deepspeed和megatron区别,以及几种并行方式,以及deepspeed的三种zero)4.了解强化学习吗,跟SFT有什么区别?5.反问:业务,对岗位的期望💣评价:有点紧张,算法题有一个小失误没注意到2️⃣二面时间:9.14 时长:1h八股1.写一下 attention 公式(代码实现了下)2.训练时为什么要mask,推理时也需要吗?两处有什么区别?推理时的sequence length和训练时一样吗3.transformer和传统seq2seq模型有什么区别?4.计算attention时为什么要除以d_k,这个d_k的含义是?5.attention计算时还有哪些scale处理?6.attention中softmax函数作用、公式、为什么有减去最大值的处理?换个函数还能这样处理吗?7.解释数值上溢、下溢问题8.讲一下prompt书写的经验,如何判断prompt是否达标,如何改进prompt9.讲一下SFT,会对哪部分计算loss?为什么?10.讲一下deepspeed11.训练用一个7b模型要占用多少显存?不同zero阶段能够节省多少显存?12.训练模型时用了几张卡,有遇到什么异常中断问题吗?反问: 在乎候选人什么能力?对面试表现有哪些改进意见?💣评价: 基础不够扎实,网上有的知识都能回答上来,在同龄人里算比较优秀,欠缺一些多机多卡实践经验。
查看17道真题和解析
点赞
评论
收藏
分享
06-05 16:16
郑州大学 算法工程师
提醒一下大模型面试进度为0的人,反正就这80页纸,熬夜背完就稳了!
点赞
评论
收藏
分享
一键发评
问下求职进度
已老实
忍耐王
mark收藏学习
陌拜大佬
评论
点赞成功,聊一聊 >
1
4
分享
评论
提到的真题
返回内容
招聘动态
查看更多
26届投递链接合集
华泰Fintech星战营
全站热榜
更多
1
...
春招失败准备转行了
2.7W
2
...
这些假国企都给我避雷!
1.5W
华为开奖进度👉
热聊中
3
...
27届腾讯一面,强度太大了..
9886
4
...
代码拜拜!被烟草录取了✌
7729
5
...
牛友们,你们有多久没回家了?
6065
6
...
在西二旗上班真的没有一点活人感
5115
7
...
作为1名HR真是不吐不快
5077
8
...
大厂实习后的一些反思与认知改变
4727
9
...
去大厂实习了,感觉跟上高中没区别啊
4569
10
...
字节实习打杂要跑路吗
4506
创作者周榜
更多
正在热议
更多
#
考研对你找工作产生了哪些影响?
#
6321次浏览
70人参与
#
打杂的实习你会去吗?
#
109145次浏览
955人参与
#
聊聊这家公司值得去吗
#
240889次浏览
2244人参与
#
机械只有读研才有出路吗?
#
20036次浏览
228人参与
#
你认为哪个岗位找工作最卷
#
17320次浏览
67人参与
#
面试被问第一学历差时该怎么回答
#
130965次浏览
823人参与
#
远程面试的尴尬瞬间
#
101192次浏览
830人参与
#
硬件人绝对不能踩的坑
#
61522次浏览
736人参与
#
工作中哪个瞬间让你想离职
#
24295次浏览
166人参与
#
kpi面有什么特征
#
36528次浏览
266人参与
#
你有哪些缓解焦虑的方法?
#
4236次浏览
146人参与
#
如何缓解入职前的焦虑
#
187494次浏览
1319人参与
#
职场人,说说你的烦心事
#
9206次浏览
83人参与
#
秋招最大的收获是什么?
#
34319次浏览
302人参与
#
实习生应该准时下班吗
#
223705次浏览
1398人参与
#
职场上哪些事情令人讨厌
#
16993次浏览
86人参与
#
你今年的平均薪资是多少?
#
126887次浏览
661人参与
#
为了找工作你投递了多少公司?
#
12862次浏览
181人参与
#
运营/市场营销人的秋招现状
#
17383次浏览
189人参与
#
数字马力求职进展汇总
#
175449次浏览
1470人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务