找工小蛋糕

05-02 03:20 门头沟学院 Java

关注

百度文心一言ai infra-实习面经

给我面没招了，发点面经攒攒人品～
1.对vllm和cuda算子哪个更感兴趣
2.为什么要有KVcache，讲一下continues batching
3.Transformer自回归生成流程，从一个文本输入开始，模型是怎么一步一步完成自回归生成的？
4.vllm整体架构，介绍核心部件
5.tp并行：基本思想，attention和gemm怎么切
6.pd分离：架构变化，KVcache变化，数据传输，给定一个常规模型，7.计算生成一个 token 占用的 KV Cache 空间公式
8.算子优化：Memory-bound 优化思路，element-wise优化思路
9.Prefix Caching，block管理，Chunked Prefill
10.gpu/cuda基础：gpu内存结构，sm基本组成，L1、L2 cache权限，reduce优化思路，wrap数据交换
11.C++/python八股：C++ 多态、虚函数；Python 深拷贝和浅拷贝、协程。
12.手撕接雨水

全部评论

推荐最新楼层

04-25 12:15

北京邮电大学 Java

阿里云 AI-Infra 一面

自我介绍实习B 平台 详细说一下；有没有碰到什么难点，如何解决的A 系统 讲一下分布式随机分片锁的细节C 系统 Checkpoint 回溯机制详细说一下八股简述 TCP 四次挥手TIME_WAIT 状态出现在哪一侧HTTP 2.0 和 1.1 的差异Linux 进程间的通信有哪几种方式HashTable 实现原理其他对最近的 OpenClaw 有研究吗

查看9道真题和解析

点赞评论收藏

分享

05-02 10:40

门头沟学院算法工程师

飞腾 AI Infra 实习一面分享

发点面经攒攒人品～基础知识1 进程与线程的核心区别是什么？Cache 的层级结构及2. 常见替换策略有哪些？3. IEEE 浮点标准中 FP16、FP32、FP64 各自的位宽分配方式是怎样的？4. 快速排序的执行流程是什么？堆的基本性质有哪些？拓扑排序适用于哪些场景？推理与算子优化5. 请阐述 Transformer 架构中 Decoder-only 结构的特点，包括 QKV 的生成过程以及位置编码的嵌入时机。6. RMSNorm 的计算公式是什么？其计算访存特性如何？可以从哪些角度进行优化（如负载均衡、Double Buffer、指令替换）？7. Softmax 的数值稳定性问题如何处理？Online Softmax 的实现原理是什么？8. 矩阵乘法与反量化融合算子在内存方面的优化策略有哪些？9. 稀疏矩阵 SpMV 运算中如何实现负载均衡与带宽优化？项目经历10. 项目深入考察。工具与工程11. Git 中拉取远程分支的操作方式有哪些？fetch+checkout 与 pull 的区别是什么？

查看11道真题和解析

点赞评论收藏

分享

04-18 13:12

香港中文大学（深圳）人工智能

【暑期实习】百度 AI Infra 一面复盘

更偏推理基础、工程细节和 CUDA 手写题这场百度 AI Infra 一面，整体感受是节奏很快，前半段主要围绕简历里的项目和实习经历往下问，后半段会明显转到一些更偏推理基础和工程理解的问题，最后还加了一道 CUDA 的手写题。面试官一开始先介绍了团队，说他们在百度智能云下面，训练、推理、强化学习、Agent 这些 AI Infra 相关方向基本都覆盖到了，所以一上来的感觉就是，这不是只盯某一个小点的岗位，而是一个工作面比较宽的 Infra 团队。正式开始之后，前面还是从我现在做的事情切进来，重点还是摩尔线程这段实习。面试官先问我怎么理解自己在做的这个 TensorFlow MUSA Exten...

查看16道真题和解析

点赞评论收藏

分享

05-01 22:15

门头沟学院 Java

文远知行暑期-AI infra 一面分享

攒攒人品！有面试过同岗的朋友欢迎评论区交流1、手撕算法：买糖果（每种糖果的价格随购买数量在两个数切换，有 n 种糖果，求 m 元最多能买多少颗）cuda：softmax2、八股：1.项目中的算子改写详情2.c++：内存管理的方法有哪些：只想到 malloc、new3.malloc 和 new 的区别：省略一个构造函数4.pinned memory5.cuda 优化方法

查看7道真题和解析

点赞评论收藏

分享

05-04 15:50

华为_系统工程师

【面试真题】百度 Agent 面经

面完之后：按记忆把题串起来说 手里那份问题清单，是好几场面谈里碎片问题的合集。 单独看每一条都像八股，串在一起你会发现面试官的注意力一直在两条线上晃：一条是「这东西在线上会不会出事」，一条是「你知不知道自己在用什么、没用上什么」。 下面按我自己后来复盘时觉得顺的思路写——从项目怎么讲，一路滑到 LangGraph、记忆、agent 形态、工具协议、RAG，最后落到后端那几道「看起来基础、其实能问穿」的题。 你如果对某一块熟，可以快速扫小标题跳读。 从项目讲起：先别急着报框架名 几乎所有 agent 岗都会从项目开刀。我踩过的坑是开场三十秒就把 LangGraph、LangChain、某某向量库...

Ai Agent：面试3...

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 这个offer值得去吗？ #

20276次浏览 173人参与

# 上班苦还是上学苦呢？ #

345150次浏览 2069人参与

# 联宝杯大学生创新大赛，你的技术值得产业级答案 #

47624次浏览 515人参与

# 如果春招能重来，我会___ #

21256次浏览 224人参与

# 实习怎么做才有更好的产出 #

49880次浏览 456人参与

# 除了线上，还能去哪些地方投简历 #

11373次浏览 115人参与

# 在爱玛，骑向未来 #

1672次浏览 161人参与

# AI coding的好用工具分享 #

88417次浏览 567人参与

# 找工作以来，你最看不惯__ #

79383次浏览 594人参与

# 字节开奖 #

150415次浏览 681人参与

# 大学四年该怎么过，才不算浪费时间？ #

23834次浏览 106人参与

# 字节7000实习来了，你投了吗？ #

55212次浏览 421人参与

# 薪资爆料 #

422229次浏览 2226人参与

# HR问：你期望的薪资是多少？如何回答 #

99323次浏览 833人参与

# 双非应该如何逆袭？ #

585878次浏览 6390人参与

# 双非本科求职如何逆袭 #

1648047次浏览 13077人参与

# 你觉得实习能学到东西吗 #

154102次浏览 1494人参与

# 哪一刻你突然觉得实习“有点值了” #

28150次浏览 176人参与

# 你被哪些公司挂了？ #

193212次浏览 1044人参与

# 字节求职进展汇总 #

1847361次浏览 15401人参与

# 金三银四，你有感觉到吗 #

777222次浏览 6329人参与

# 毕业后不工作的日子里我在做什么 #

269071次浏览 1739人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务