首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
大厂算法Offer情报官
06-04 15:31
门头沟学院 算法工程师
发布于天津
关注
已关注
取消关注
大模型面经每日总结
#面经#
#大模型#
#量化#
网易大模型量化面经
0.常见的量化方法有哪些?
原理及适用场景,并分析它们在计算复杂度和精度损失上的差异
1.PTQ 和 QAT 咋选?
2.低比特量化在智能音箱能用吗?
3.语音识别量化有啥难题和办法?
4.模型量化和其他压缩技术配合经验
5.QAT中,量化噪声模拟的作用是什么?
6.在多头注意力机制 前馈神经网络 ,量化策略有何不同?
7.针对 ARM 架构的芯片 如何优化量化模型的推理速度?
全部评论
推荐
最新
楼层
暂无评论,快来抢首评~
相关推荐
06-05 16:44
门头沟学院 算法工程师
大模型面经每日总结(奇安信2025/6/5)
简述 Transformer 多头注意力机制理解词间关系的原理。训练 Transformer 时,如何解决梯度消失或梯度爆炸问题?GPT 等模型对 Transformer 结构做了哪些改进以提升生成效果?如何优化 Transformer 模型预测速度?说明 RAG 结合外部知识库与大语言模型提升回答准确性的机制。用 RAG 构建问答系统时,如何处理检索内容不相关或不全的问题?如何确定 RAG 系统中文档的合适切分粒度?当 RAG 系统知识库数据量大、检索慢时,有哪些提速方法?如何协同使用 Transformer 与 RAG 以发挥最佳效果?用 RAG 优化模型回答,有哪些实用...
查看12道真题和解析
点赞
评论
收藏
分享
06-06 09:56
门头沟学院 算法工程师
大模型面经每日总结 (京东大模型实习)
1. 基础概念题:什么是大模型核心加速技术中的 “算子融合”?举例说明其作用。答案要点:算子融合是将多个连续计算算子合并为一个,减少计算图中的节点数和显存读写次数,降低延迟。举例:如将 Transformer 中的 Add(残差连接)与 RMSNorm(归一化)融合,减少两次内存访问,提升推理速度。2. 技术原理题:Flash Attention V2 如何优化注意力计算效率?与 V1 的核心区别是什么?答案要点:• V1:通过分块计算注意力,减少显存占用(避免存储所有中间键值对)。• V2:引入 “内外循环交换策略”,将矩阵乘法的循环顺序调整为更适合 GPU 并行计算的模式,进一步提升计算效率,尤其在长序列场景下加速明显。3. 量化技术中,FP8、INT4 AWQ、INT4-FP8 AWQ 的适用场景和压缩率有何差异?4. RAG 系统中,文档切分粒度如何影响检索和生成效果?实际中如何确定最优粒度?5.在长序列推理场景中,PagedAttention 和 Prefix Caching 分别解决什么问题?如何配合使用?答案要点:• PagedAttention:将 KV Cache 分块存储在非连续显存中,避免显存碎片,支持处理超长序列(如百万 Token);• Prefix Caching:缓存历史对话的 KV 对,跨请求复用,减少重复计算(如多轮对话中复用上文缓存)。配合逻辑:PagedAttention 解决显存限制,Prefix Caching 减少计算量,两者结合可提升长对话场景的效率和稳定性。6. 在企业级推理场景中,如何根据需求选择量化方案?举例说明短文本高并发和长文本场景的优化策略。实时客服系统用 INT4 量化加速响应;金融报告生成场景用 FP8+PagedAttention 处理数千 Token 输入。
点赞
评论
收藏
分享
06-03 19:25
已编辑
门头沟学院 Java
大模型面经 (第二期)
上期写道刚开始面试的时候,这期写一写5月11号时候,这个时候手上就已经有两三家offer了,然后去北京的前一两天又发了三家offer随便选了个离公司近的工资高点的就去了。那么这期还是讲一下怎么去面试。其实面试的东西都一样,就是说你干过什么,回答问题就行了你要考虑的,不是这么去背八股文,而是要去琢磨到底要不要去实习,我个人而言,我最开始是因为电脑配置带不动才去好点的公司有好的卡给我用,然后呢去了也有工资,但是我的自由被限制了,我没法再天天琢磨新玩意我很痛苦,然后学会了怎么摸鱼,人家都是9点半来,我一开始是8点40到,我现在就吃了早饭再去差不多9点能到(就尽力偷懒还是最勤奋的那一批,因为人家都是老...
查看13道真题和解析
牛客激励计划
面试问题记录
点赞
评论
收藏
分享
05-28 20:13
中山大学 算法工程师
强度拉满:网易大模型算法岗
1️⃣一面时间:9.12 时长:1hcode:统计岛屿数量、最大岛屿面积,DFS方法解了然后介绍实习项目,面试官非常耐心地听,没有打断八股1.bert和gpt的区别?(从模型架构、训练方式、使用场景方面回答的)2.训练/微调一个LLM的流程?3.实习时用的 megatron 框架吗,对分布式训练框架了解多少?(回答了deepspeed和megatron区别,以及几种并行方式,以及deepspeed的三种zero)4.了解强化学习吗,跟SFT有什么区别?5.反问:业务,对岗位的期望💣评价:有点紧张,算法题有一个小失误没注意到2️⃣二面时间:9.14 时长:1h八股1.写一下 attention 公式(代码实现了下)2.训练时为什么要mask,推理时也需要吗?两处有什么区别?推理时的sequence length和训练时一样吗3.transformer和传统seq2seq模型有什么区别?4.计算attention时为什么要除以d_k,这个d_k的含义是?5.attention计算时还有哪些scale处理?6.attention中softmax函数作用、公式、为什么有减去最大值的处理?换个函数还能这样处理吗?7.解释数值上溢、下溢问题8.讲一下prompt书写的经验,如何判断prompt是否达标,如何改进prompt9.讲一下SFT,会对哪部分计算loss?为什么?10.讲一下deepspeed11.训练用一个7b模型要占用多少显存?不同zero阶段能够节省多少显存?12.训练模型时用了几张卡,有遇到什么异常中断问题吗?反问: 在乎候选人什么能力?对面试表现有哪些改进意见?💣评价: 基础不够扎实,网上有的知识都能回答上来,在同龄人里算比较优秀,欠缺一些多机多卡实践经验。
查看17道真题和解析
点赞
评论
收藏
分享
05-26 23:39
已编辑
门头沟学院 研发工程师
重庆某 AI 厂面经
自我介绍Go 是自学的吗?你们主要学 C++、Java,你为什么选择学 Go?讲讲你的登录校验机制(cookie jwt)?单点登录?prometheus 主要监控的什么?评测是如何做的,远程评测和本地评测是如何切换的?Mongodb 的分页查询、count 查询、分片,调优熟悉吗看你用了 MinIO,底层了解吗?服务注册发现怎么做的?服务端宕机,客户端调用失败怎么解决是直接依赖 etcd 吗,自己有实现相关的注册、发现、监听机制吗?有实现过哪些负载均衡算法?--随机、轮询、加权随机、加权轮询、哈希、一致性哈希讲讲加权轮询?反问:对面试评价怎么样?--做的偏上层、底层差一点(主要是 Mongo...
查看16道真题和解析
点赞
评论
收藏
分享
一键发评
问下求职进度
已老实
忍耐王
mark收藏学习
陌拜大佬
评论
点赞成功,聊一聊 >
1
4
分享
评论
提到的真题
返回内容
招聘动态
查看更多
26届投递链接合集
华泰证券Fintech星战营
全站热榜
更多
1
...
春招失败准备转行了
1.2W
2
...
这些假国企都给我避雷!
1.2W
华为开奖进度👉
热聊中
3
...
代码拜拜!被烟草录取了✌
9371
4
...
27届腾讯一面,强度太大了..
7039
5
...
论双非大一的“暑期”能拿下大厂offer吗?
6130
6
...
牛友们,你们有多久没回家了?
5774
7
...
宝宝你是最棒的宝宝
5254
8
...
字节实习打杂要跑路吗
4839
9
...
大厂实习后的一些反思与认知改变
4626
10
...
作为1名HR真是不吐不快
4158
创作者周榜
更多
正在热议
更多
#
考研对你找工作产生了哪些影响?
#
4607次浏览
54人参与
#
机械只有读研才有出路吗?
#
19811次浏览
228人参与
#
聊聊这家公司值得去吗
#
238623次浏览
2232人参与
#
打杂的实习你会去吗?
#
108504次浏览
949人参与
#
你认为哪个岗位找工作最卷
#
16278次浏览
65人参与
#
远程面试的尴尬瞬间
#
100954次浏览
828人参与
#
硬件人绝对不能踩的坑
#
61283次浏览
736人参与
#
kpi面有什么特征
#
35477次浏览
263人参与
#
工作中哪个瞬间让你想离职
#
24144次浏览
166人参与
#
如何缓解入职前的焦虑
#
187217次浏览
1319人参与
#
你有哪些缓解焦虑的方法?
#
3205次浏览
129人参与
#
面试被问第一学历差时该怎么回答
#
130639次浏览
822人参与
#
职场人,说说你的烦心事
#
8996次浏览
83人参与
#
实习生应该准时下班吗
#
223468次浏览
1398人参与
#
秋招最大的收获是什么?
#
34155次浏览
301人参与
#
职场上哪些事情令人讨厌
#
16867次浏览
86人参与
#
为了找工作你投递了多少公司?
#
11864次浏览
162人参与
#
你今年的平均薪资是多少?
#
126710次浏览
661人参与
#
运营/市场营销人的秋招现状
#
17219次浏览
189人参与
#
担心入职之后被发现很菜怎么办
#
126877次浏览
760人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务