牛客464628842号

2024-04-01 10:02 中国科学院大学 C++

关注

推理部署优化/高性能开发春招总结-1

腾讯
    一面
        1. Tensorrt-LLM, AGI , VLLM源代码区别
        2. 为什么要有continue batch
        3. fastllm.cpp 的源代码
        4. yolo加速
        5. Python 计算密集型使用多进程还是多线程
        6. C++继承怎么实现的
        7. 最大子数组之和
    二面
        1. 求比特位中1个个数
        2. 编译时运行
        3. VLLM ，PageAttention
        4. Cuda 内存模型介绍
        5. 使用triton 实现 PageAttention
    二面挂

#金三银四，你有感觉到吗#
#春招提前批，你开始投了吗#

全部评论

推荐最新楼层

草帽小路飞

门头沟学院 C++

佬，面的啥部门呀

3 回复分享

发布于 2024-04-02 00:17 广东

四川大学 Java

大佬自学吗还是课题组方向

1 回复分享

发布于 2024-04-28 08:48 黑龙江

浙江大学 C++

请问应该投什么岗位呢这个方向

1 回复分享

发布于 2024-04-13 20:00 浙江

浙江大学 Java

面得这么恐怖吗

点赞回复分享

发布于 2024-09-22 20:53 浙江

不讲道理的咸鱼躺平了

华中科技大学 C++

mark

点赞回复分享

发布于 2024-06-20 00:20 湖北

喜欢编程的番茄

门头沟学院后端工程师

大佬，这个岗位投递名字是啥啊

点赞回复分享

发布于 2024-06-02 15:36 湖北

中南大学 C++

mark

点赞回复分享

发布于 2024-05-07 21:13 湖南

中南大学 C++

mark

点赞回复分享

发布于 2024-05-07 21:13 湖南

武汉大学 Java

mark

点赞回复分享

发布于 2024-04-15 21:56 湖北

石家庄石门实验学校深度学习

佬，triton实现pagedattention是手撕吗

点赞回复分享

发布于 2024-04-04 14:12 广东

03-25 18:57

浙江大学算法工程师

小米 C++ 二面攒人品了

二面明显比一面难度上了一个台阶，面试官是组内 senior，开场直接问项目深挖，每个技术决策都要说清楚为什么这么做、有没有更好的方案。八股比例少了，更多是系统设计和场景题，考察你有没有真正在工程里踩过坑。代码题也更偏综合，不是纯算法，而是结合实际场景。整体感受是：说不知道比瞎说好，面试官很容易听出来你是背的还是真懂的。1. 自我介绍 + 项目深挖略（重点准备：项目中遇到的性能瓶颈、你做了什么优化、结果如何量化）2. C++ 内存模型中的 memory order 有哪些？memory_order_relaxed 和 memory_order_seq_cst 的区别？C++11 定义了六种内存序...

C++八股文全集

点赞评论收藏

分享

03-04 12:53

门头沟学院机器学习

字节大模型算法二面难死了...

祝大家都能拿到满意的Offer！1. 项目拷打2. 详细阐述Transformer的底层原理，并说明其能够替代RNN的核心优势；结合Transformer架构的成熟度，分析Self-Attention机制在多模态对齐任务中是否存在瓶颈，以及在实际业务场景中，是否出现过注意力权重完全偏移的情况。3. 讲解LoRA的技术原理，说明LoRA是否仅能嵌入Linear层；分析LoRA无法在LayerNorm层之后插入的原因，以及该操作会对模型训练稳定性产生哪些具体影响。4. 结合实操经验，说明QLoRA降低训练资源成本的核心逻辑；列举常见的模型量化方式，并解释QLoRA选择NF4与FP16组合而非其他方案的原因，阐述NF4的分布拟合逻辑。5. 针对采用multi-query attention优化后，decoder延迟仍居高不下的问题，分析潜在性能瓶颈；探讨vLLM自带的KV Cache是否会成为推理过程中的负担。6. 分别说明Embedding模型与Rerank模型处理文本语料的核心流程，并结合实际应用场景举例说明。7. 结合过往RAG项目经验，讲解从数据清洗到检索服务上线的完整链路搭建流程，重点说明chunk切分的具体策略。8. 分析当前RAG技术落地的最大瓶颈，并阐述你在项目中采取过哪些优化手段来提升检索召回率（Recall）。9. 针对XX领域大模型的训练工作，说明SFT（监督微调）数据集的构造方法与核心思路。10. 结合LoRA微调实操经历，说明rank值的选择依据；在合并adapter权重的过程中，是否遇到过梯度爆炸问题，以及对应的解决方法。11. 结合你的模型部署相关经验，说明模型参数量与硬件算力需求之间的对应关系（例如不同参数量级模型所需的算力配置标准）；以部署一个稀疏率千分之三的235B参数量MOE架构模型为例，估算其所需的算力规模。12. 在搭建RAG知识库时，若需对文档进行动态更新，你采用的是全量嵌入还是增量处理方案？若为增量处理，如何规避新旧文档数据分布不一致导致的检索偏差问题。13. 针对机械臂动作态融合相关工作，说明数据融合的具体实现方案，以及对比实验的设计思路与评估指标。

查看12道真题和解析

点赞评论收藏

分享

03-25 16:20

门头沟学院 C++

小米汽车软件工程师-C++ 一面

1、make_shared 了解过吗？答案：了解。make_shared 本质上是用来创建 shared_ptr 的工厂函数。和直接 shared_ptr<T>(new T(...)) 相比，它通常只做一次内存分配，把对象本体和控制块放在一块连续内存里，所以性能更好，缓存局部性也更好。另外它异常安全性也更强，像复杂表达式里直接 new 可能在构造 shared_ptr 前抛异常，make_shared 可以避免这种问题。但它也不是所有场景都适合。比如对象特别大、你希望对象和控制块分开释放，或者需要自定义删除器，那就不一定用 make_shared。因为只要还有 weak_ptr 持...

C++ 常考面试题总结

点赞评论收藏

分享

03-03 05:25

门头沟学院机器学习

飞腾AI infra实习一面 40min

祝大家都能拿到满意的Offer！1. 项目深挖2. Transformer架构与多头注意力机制细节（Decoder-only结构、QKV生成、位置编码嵌入时机）3. RMSNorm公式、计算访存特性及优化方法（负载均衡/Double Buffer/指令替换）4. Softmax数值稳定性处理与Online实现5. 矩阵乘与反量化融合算子的内存优化策略6. 稀疏矩阵SpMV的负载均衡与带宽优化7. IEEE浮点标准（FP16/32/64位分配）8. 基础算法：快排步骤、堆性质、拓扑排序适用场景9. 系统基础：进程/线程区别、Cache层级与替换策略10. 工具链：Git分支操作命令（fetch+checkout vs pull）

查看10道真题和解析

点赞评论收藏

分享

03-26 13:09

吉林农业大学算法工程师

信雅达 AI Agent开发二面

1. 你做过的 Agent 项目里，Agent 和普通问答系统最大的区别是什么？普通问答系统更多是输入一个问题，模型生成一个回答，核心在回答质量。Agent 更强调任务闭环，不只是回答，还要规划步骤、调用工具、拿到结果、根据结果继续下一步，最后把任务完成。也就是说，问答系统重点是“说”，Agent 重点是“做”。如果项目里接了数据库查询、知识库检索、接口调用、审批流或者脚本执行，那基本就已经不是单纯的聊天系统了。2. 你怎么理解 Agent 的核心组成？一个完整的 Agent 一般包括模型、Prompt、工具、记忆、规划、执行控制这几部分。模型负责理解和推理，Prompt 负责约束行为，工具负...

AI-Agent面试实战...

点赞评论收藏

分享

评论

7

110

招聘动态

联想

27届暑期实习

奥克斯集团

2026春季校园招聘

鹏芯微

2026届校园招聘

小米集团

2026届春季校园招聘

厦门银行

2026届春季校园招聘

联想

26届补录

携程集团

2026年春季校园招聘

AI网申助手

网申字段一键填写

恒生电子

2026届春季校园招聘

27届校招宝典

全站热榜

更多

创作者周榜

更多

正在热议

更多

# AI面会问哪些问题？ #

20856次浏览 428人参与

# 投递几十家公司，到现在0offer，大家都一样吗 #

338432次浏览 2151人参与

# 厦门银行科技岗值不值得投 #

6830次浏览 165人参与

# 你的实习产出是真实的还是包装的？ #

16984次浏览 315人参与

# 通信硬件2023笔面经 #

50403次浏览 304人参与

# 一张图晒出你司的标语 #

3209次浏览 62人参与

# 开放七大实习专项，百度暑期实习值得冲吗 #

12720次浏览 184人参与

# 蔚来求职进展汇总 #

117035次浏览 794人参与

# 找AI工作可以去哪些公司？ #

5867次浏览 145人参与

# 从事AI岗需要掌握哪些技术栈？ #

6021次浏览 191人参与

# 你做过最难的笔试是哪家公司 #

24624次浏览 146人参与

# 春招至今，你的战绩如何？ #

54027次浏览 490人参与

# 沪漂/北漂你觉得哪个更苦？ #

8186次浏览 175人参与

# 聊聊这家公司值得去吗 #

914586次浏览 4736人参与

# AI时代，哪个岗位还有“活路” #

9467次浏览 293人参与

# 长得好看会提高面试通过率吗？ #

20104次浏览 235人参与

# 阿里笔试 #

172482次浏览 1257人参与

# HR最不可信的一句话是__ #

4887次浏览 98人参与

# 春招你拿到offer了吗 #

827219次浏览 9972人参与

# 学历对求职的影响 #

660923次浏览 4232人参与

# 应届生初入职场，求建议 #

318235次浏览 2895人参与

# 实习的你做了哪些离谱的工作 #

38740次浏览 253人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务