传奇新牛马

05-01 18:05 门头沟学院算法工程师

关注

遂原科技 AI Infra 27实习一面

发点面经攒攒人品～
项目经历
1. 实习拷打
2. 项目拷打

量化相关
3. 量化策略的选择依据：为何选用 INT8 量化，A100 与 H100 对不同量化精度的支持情况
4. 量化对象是模型权重还是 KV-Cache，scale 参数如何确定
5. 量化后是否进行过精度损失的评测

算子开发
6. Triton 算子的实现逻辑，包括分块等策略
7. 对比所用的官方 baseline 选择及数据类型
8. 性能提升数据的来源，动态分块策略与算子配置
9. 是否考虑过使用 CUDA 替代 Triton 进行算子开发，选择 Triton 的原因
10. 是否做过 profiling，内存吞吐等性能指标表现如何，后续有何优化思路

推理优化
11. Attention 模块在整个系统端到端延迟中所占比例
12. Decode 阶段属于 compute bound 还是 memory bound，KV-Cache 量化提升的是哪方面性能
13. A100 的理论显存带宽上限

全部评论

推荐最新楼层

不愿透露姓名的神秘牛友

04-30 17:45

不愧是字节，问的好难啊🤯

本人简历上 1 个 RAG 项目 + 1 个 Agent demo；这次面的是AI岗一面前我以为：背完八股 + 把项目讲清楚，应该能稳过。0-5 min：自我介绍 + 项目背景- 顺利。讲清楚了我的 RAG 是给法律咨询场景做的，痛点是大模型不懂行业术语。5-20 min：项目深挖（开始崩）- Q1：你的法律文档总共多少？切了多少个 chunk？- 我：约 500 份 PDF，5 万个 chunk- Q2：500 份 PDF 加起来才 5 万 chunk？平均每份 100 个 chunk，你切片粒度是多少？- 我：512 token- Q3：法律文档里"第三条第二款"和"第三条之二"是不同含义，你的切片会不会把它切散？- 我：（沉默 5 秒）……应该会- Q4：那你怎么解决？- 我：我可以加一个 metadata……（开始编）❌ 第一次崩：切片粒度没考虑业务语义。20-35 min：评测体系（继续崩）- Q：你怎么知道你的 RAG 有效？- 我：我用 Recall@5……- Q：评测集多少条？怎么构造的？- 我：100 条，我手工标注的- Q：100 条够吗？分布怎么样？- 我：分布……我没分- Q：那你的 Recall@5 是 0.81，你怎么知道这个数字是好是坏？baseline 是什么？- 我：（沉默 10 秒）❌ 第二次崩：没有 baseline，没分布分析，纯靠"看起来还行"。35-55 min：Agent 部分（彻底崩）- Q：你的 Agent demo 用了几个工具？- 我：3 个，搜索、计算器、文档查询- Q：当用户问一个问题，你的 Agent 怎么决定调哪个工具？- 我：用 ReAct，让模型自己决定- Q：模型决策错了怎么办？- 我：我加了个 reflection……- Q：reflection 失败 3 次后怎么处理？- 我：（沉默 15 秒）……我没想过❌ 第三次崩：异常路径完全没设计。55-65 min：业务理解 + 反问- Q：你觉得字节做 AI 应用最大的瓶颈是什么？- 我：算力？数据？- Q：你看过哪些字节最近发的 AI 产品？- 我：豆包、扣子……- Q：扣子是 Agent 平台还是工作流平台？- 我：（再次沉默）❌ 第四次崩：对面试公司业务一无所知。

面试官拷打AI项目都会问...

点赞评论收藏

分享

04-17 16:46

上海交通大学算法工程师

从0到1：OpenClaw避坑实录，这些坑我都踩过了

说是5分钟安装，但我第一次部署OpenClaw，前前后后花了两小时。 不是因为难，而是因为——坑太多。 有些坑是文档没写清楚，有些坑是我自己操作失误，还有些坑是环境配置问题。 总之，踩完一圈坑之后，我决定把这些经验整理出来，帮后来者省点时间。 踩过的这些坑，其实有本手册里都有解决方案。完整的部署步骤、配置细节，可以看《2026OpenClaw完全使用手册》。 坑1：Node.js版本太老 现象 安装依赖时报错： error: The engine "node" is incompatible with this module.  原因 我的电脑上装的是Node.js 10....

点赞评论收藏

分享

昨天 10:40

门头沟学院算法工程师

飞腾 AI Infra 实习一面分享

发点面经攒攒人品～基础知识1 进程与线程的核心区别是什么？Cache 的层级结构及2. 常见替换策略有哪些？3. IEEE 浮点标准中 FP16、FP32、FP64 各自的位宽分配方式是怎样的？4. 快速排序的执行流程是什么？堆的基本性质有哪些？拓扑排序适用于哪些场景？推理与算子优化5. 请阐述 Transformer 架构中 Decoder-only 结构的特点，包括 QKV 的生成过程以及位置编码的嵌入时机。6. RMSNorm 的计算公式是什么？其计算访存特性如何？可以从哪些角度进行优化（如负载均衡、Double Buffer、指令替换）？7. Softmax 的数值稳定性问题如何处理？Online Softmax 的实现原理是什么？8. 矩阵乘法与反量化融合算子在内存方面的优化策略有哪些？9. 稀疏矩阵 SpMV 运算中如何实现负载均衡与带宽优化？项目经历10. 项目深入考察。工具与工程11. Git 中拉取远程分支的操作方式有哪些？fetch+checkout 与 pull 的区别是什么？

点赞评论收藏

分享

04-09 09:26

门头沟学院 Java

别再吵了！学历VS实习

天天在牛客上刷到“双非本科没实习是不是没救了”“985硕士零实习能冲大厂吗”，吵来吵去就是学历和实习哪个更重要，我真的看烦了。今天必须说句大实话：校招里，学历和实习哪个更重要，完全取决于你有什么、缺什么。你缺的那个，就是对你来说最重要的。网上那些极端言论，要么说“学历至上，双非根本没机会”，要么说“实习为王，学历没用”，全是站着说话不腰疼，根本没搞懂校招的残酷真相。先揭穿第一个真相：学历，是给你开门的钥匙；实习，是让你留下来的门票。很多双非的同学说，我投了几百份简历，全石沉大海，实习再牛有什么用？连面试机会都拿不到。这太真实了。大厂校招，简历池里几万份简历，HR根本没功夫一份一份看你的实习项目...

学历VS实习，哪个更重要...

点赞评论收藏

分享

04-28 15:18

门头沟学院 Java

这些求职渠道别错过

很多人找工作只会单纯依赖招聘软件海投，同质化竞争严重，回复率还特别低。但也别过度神化线下双选会、宣讲会，大多流程形式化，岗位质量参差不齐，扎堆投递也很难脱颖而出。真正实用的小众渠道反而更容易捡漏，靠谱校友、往届学长的企业内推，能直接跳过机器初筛，直达业务 HR。本地产业园、行业专属专场招聘会，岗位更对口，小众优质公司集中。还有企业官网招聘入口、线下开放日、行业交流沙龙，常会放出冷门补录岗位。求职别只盯单一方式，合理搭配渠道，避开拥挤赛道，才能有效提升上岸概率。

除了线上，还能去哪些地方...

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 这个offer值得去吗？ #

13220次浏览 149人参与

# 金三银四，你的春招进行到哪个阶段了？ #

35271次浏览 330人参与

# 联宝杯大学生创新大赛，你的技术值得产业级答案 #

45952次浏览 509人参与

# 如果春招能重来，我会___ #

14824次浏览 179人参与

# Prompt分享 #

77216次浏览 1274人参与

# 除了线上，还能去哪些地方投简历 #

8455次浏览 99人参与

# 校招第一份工作你干了多久？ #

152839次浏览 640人参与

# 硬件人秋招进展 #

292035次浏览 4042人参与

# 你觉得实习能学到东西吗 #

153183次浏览 1480人参与

# 搜狐工作体验 #

6793次浏览 54人参与

# 反问环节如何提问 #

141349次浏览 2740人参与

# 想做Agent可以做哪些岗位？ #

12649次浏览 407人参与

# 面试官拷打AI项目都会问什么？ #

11714次浏览 416人参与

# 招银网络科技（深圳）有限公司成都分公司笔试 #

6031次浏览 23人参与

# 你觉得最好用的AI编程工具是_ #

4564次浏览 94人参与

# 哔哩哔哩笔试 #

42296次浏览 166人参与

# 军工所铁饭碗 vs 互联网高薪资，你会选谁 #

13998次浏览 79人参与

# 你实习是赚钱了还是亏钱了？ #

127269次浏览 715人参与

# 大厂还是考编 #

134499次浏览 1398人参与

# 非技术岗简历怎么写 #

338660次浏览 3301人参与

# 实习第一天，你在干什么 #

8870次浏览 106人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务