求职战斗鸡

02-05 20:25 合肥工业大学算法工程师

关注

腾讯大模型面经分享攒人品中..

1.实习介绍
2.大模型微调框架：您在微调大模型时使用过哪些框架（如LoRA、QLoRA等）？请结合实际场景说明选择依据。
3.CLIP优化：CLIP模型的zero-shot能力是如何实现的？请从模型设计和训练策略角度分析，并提出改进其跨模态检索效果的方案。
4.归一化层差异：Transformer中Pre-Norm和Post-Norm的设计差异是什么？对模型训练稳定性和性能有何影响？
5.模型架构选型：在生成式大模型（如LLaMA、GPT）中，为何通常采用Decoder-only架构而非Encoder-Decoder结构？
6.自然语言理解实现：请描述大模型中自然语言理解模块的具体实现方案，包括语义解析和意图识别的关键技术。
7.Transformer推理加速：针对Transformer模型推理过程，您会采用哪些优化手段（如KV Cache、算子融合等）？请说明原理及收益。
8.RAG技术：请阐述检索增强生成（RAG）的核心原理，并说明如何通过RAG缓解大模型的幻觉问题。
9.vLLM优化：vLLM框架的核心优化原理是什么？其在动态批处理（Dynamic Batching）和显存管理上有哪些创新设计？
10.对齐算法对比：请对比RLHF、PPO、DPO算法的技术差异、优缺点及适用场景

全部评论

推荐最新楼层

嵌入式的小白

西安理工大学嵌入式软件开发

年底面的，你这是实习的还是正式岗位的？

点赞回复分享

发布于 02-08 16:05 陕西

长沙学院 Java

Transformer中Pre-Norm和Post-Norm的设计差异是什么咋回答的

点赞回复分享

发布于 02-07 15:50 湖南

03-06 09:16

浙江大学算法工程师

格蓝若 C++软件开发二面面经

1. 先简单介绍一下你自己，重点说说你最擅长的技术领域和最有成就感的项目。面试官您好，我是XXX。我最擅长的是C++后端开发和系统编程，对高性能服务器、分布式系统比较有研究。最有成就感的项目是我做的分布式缓存系统，从零开始设计实现，经历了性能优化、架构演进的完整过程。最初QPS只有几万，通过内存池、无锁队列、零拷贝等优化，最终达到了20万QPS。这个项目让我深入理解了高性能系统的设计原理，也锻炼了解决复杂问题的能力。除此之外，我对Linux系统编程、网络编程、多线程编程都有比较深入的实践。2. 详细说说你的缓存系统项目，从系统设计的角度介绍架构、技术选型、关键设计决策。这个缓存系统的设计目标是...

C++八股文全集

点赞评论收藏

分享

03-16 05:30

门头沟学院机器学习

携程大模型算法实习面经分享

攒人品中，祝大家都能拿到满意的Offer！1.lora微调原理2.P tuning3.强化学习 ppo grpo4.prompt 微调5.attention结构6.gpt12的结构7.Deepseek r1 训练四个阶段8.Encoder only decoder only 区别9.Llamma12的结构10.Deepseekv2 v3 r1 r1 zero的结构和训练过程11.探讨moe技术细节以及未来发展的困境

查看11道真题和解析

点赞评论收藏

分享

03-20 14:57

蚌埠坦克学院嵌入式软件开发

眼谷科技嵌入式软件开发二面总结

 1.自我介绍面试官好，我换个角度介绍一下自己。一面主要聊了技术细节，这次我想说说我对嵌入式开发的理解和职业规划。我选择嵌入式这个方向，是因为喜欢软硬结合、能看到实际产品的感觉。相比纯软件开发，嵌入式更贴近硬件，需要考虑资源限制、实时性、功耗等问题，这种约束反而让我觉得有挑战性。特别是嵌入式AI这个领域，如何在有限的算力和内存下实现智能功能，这个问题很吸引我。技术上，我主要用C++做开发，熟悉Linux系统和交叉编译，有模型部署的实际经验。在项目中遇到过性能瓶颈、内存不足等问题，通过优化算法、使用硬件加速等方式解决。这些经历让我理解了嵌入式开发的特点：不只是写代码，还要理解硬件、优化性能、权衡...

嵌入式面试八股文全集

点赞评论收藏

分享

03-07 09:25

门头沟学院推荐算法

大模型算法实习面经-字节跳动

给我面没招了。。。1. 项目拷打2. 详细阐述Transformer的底层原理，并说明其能够替代RNN的核心优势；结合Transformer架构的成熟度，分析Self-Attention机制在多模态对齐任务中是否存在瓶颈，以及在实际业务场景中，是否出现过注意力权重完全偏移的情况。3. 讲解LoRA的技术原理，说明LoRA是否仅能嵌入Linear层；分析LoRA无法在LayerNorm层之后插入的原因，以及该操作会对模型训练稳定性产生哪些具体影响。4. 结合实操经验，说明QLoRA降低训练资源成本的核心逻辑；列举常见的模型量化方式，并解释QLoRA选择NF4与FP16组合而非其他方案的原因，阐述NF4的分布拟合逻辑。5. 针对采用multi-query attention优化后，decoder延迟仍居高不下的问题，分析潜在性能瓶颈；探讨vLLM自带的KV Cache是否会成为推理过程中的负担。6. 分别说明Embedding模型与Rerank模型处理文本语料的核心流程，并结合实际应用场景举例说明。7. 结合过往RAG项目经验，讲解从数据清洗到检索服务上线的完整链路搭建流程，重点说明chunk切分的具体策略。8. 分析当前RAG技术落地的最大瓶颈，并阐述你在项目中采取过哪些优化手段来提升检索召回率（Recall）。9. 针对XX领域大模型的训练工作，说明SFT（监督微调）数据集的构造方法与核心思路。10. 结合LoRA微调实操经历，说明rank值的选择依据；在合并adapter权重的过程中，是否遇到过梯度爆炸问题，以及对应的解决方法。11. 结合你的模型部署相关经验，说明模型参数量与硬件算力需求之间的对应关系（例如不同参数量级模型所需的算力配置标准）；以部署一个稀疏率千分之三的235B参数量MOE架构模型为例，估算其所需的算力规模。12. 在搭建RAG知识库时，若需对文档进行动态更新，你采用的是全量嵌入还是增量处理方案？若为增量处理，如何规避新旧文档数据分布不一致导致的检索偏差问题。

点赞评论收藏

分享

03-04 22:29

门头沟学院算法工程师

影石多模态大模型算法工程师一面面经攒人品

社招第一次面试手撕了这么多代码.....太硬核了！基操：项目做的是什么？你训练算法过程中一般用哪些损失函数？中途插入问题：qwenvl系列的模块设计由哪些部分组成？然后就直接开始手撕代码了：多模态输入、Token 处理、Self/Cross Attention、Mask、LoRA、Dataset/DataLoader、训练流程、累计梯度、eval、多进程通信、微调方法 全都要会写代码。多模态大模型算法岗 · 高频面试题 + 标准答案（完整版）1. 多模态模型（图文）输入是怎么 Tokenize 的？答：文本用文本分词器转成文本 Token。图片不直接分词，而是切成固定大小的 Patch，每个 ...

查看20道真题和解析

点赞评论收藏

分享

评论

2

15

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 你的实习产出是真实的还是包装的？ #

19605次浏览 341人参与

# 中国电信笔试 #

31495次浏览 284人参与

# 米连集团26产品管培生项目 #

13158次浏览 285人参与

# 春招至今，你的战绩如何？ #

62916次浏览 571人参与

# 如果秋招能重来，我会____ #

96841次浏览 500人参与

# 一张图晒出你司的标语 #

4094次浏览 74人参与

# 厦门银行科技岗值不值得投 #

7753次浏览 186人参与

# i人适合做什么工作 #

37060次浏览 124人参与

# 我是面试官，请用一句话让我破防 #

79653次浏览 219人参与

# 金三银四，你的春招进行到哪个阶段了？ #

21892次浏览 280人参与

# 哪些公司真双非友好？ #

69459次浏览 287人参与

# 投递几十家公司，到现在0offer，大家都一样吗 #

340422次浏览 2170人参与

# AI面会问哪些问题？ #

26696次浏览 536人参与

# 找AI工作可以去哪些公司？ #

8522次浏览 217人参与

# 从事AI岗需要掌握哪些技术栈？ #

8425次浏览 282人参与

# 面试尴尬现场 #

220907次浏览 861人参与

# 五一之后，实习真的很难找吗？ #

102859次浏览 584人参与

# 你做过最难的笔试是哪家公司 #

32085次浏览 215人参与

# 应届生第一份工资要多少合适 #

20612次浏览 86人参与

# 聊聊你的职场新体验 #

336276次浏览 1894人参与

# 你小时候最想从事什么职业 #

159938次浏览 2072人参与

# 阿里笔试 #

177776次浏览 1307人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务