01-07 15:30 西安交通大学算法工程师

关注

虾皮大模型算法实习面经攒人品

1.在 RAG 应用中是如何做效果评估具体用了哪些指标
2.如何训练用于 RAG 场景的生成模型
3.vLLM 的核心原理是什么
4.如何增强模型的多轮对话能力
5. CoT ( Chain - of - Thought )训练数据如何构造
6.介绍vL LM 、量化、 KV Cache 优化技巧
7." packing "形式和"多轮对话"形式有何区别？
8.LeetCode 72编辑距离

全部评论

推荐最新楼层

哈哈哈，你是老六

门头沟学院大数据开发工程师

感觉这个挺难的啊

点赞回复分享

发布于 01-24 15:54 北京

长沙学院 Java

如何训练用于 RAG 场景的生成模型咋回答的啊

点赞回复分享

发布于 01-19 19:57 云南

03-07 09:24

门头沟学院 Java

面试AI技术研发岗的必刷题单

备战AI技术研发岗（算法/大模型/多模态）面试，刷题不能盲目！以下题单覆盖面试90%高频考点，不用贪多，刷透这些就够了！一、算法基础必刷题（重中之重，刷50-60题）核心目标：应对面试手撕代码，基础不丢分，这是入门门槛，不能偷懒！刷题范围：LeetCode 中等难度为主，重点刷数组、链表、栈队列、二叉树、动态规划、贪心，不用刷难题怪题，聚焦高频题。必刷重点：两数之和、二叉树的遍历（前中后序，递归+迭代）、最长回文子串、最长递增子序列、LRU缓存机制、TopK问题、二分查找（各种变体）。刷题数量：每天1-2题，总共刷50-60题，刷完复盘总结，确保同类题能举一反三，避免刷了就忘。二、机器学习必刷...

查看27道真题和解析

点赞评论收藏

分享

03-07 04:25

门头沟学院推荐算法

阿里大模型校招面经俺不中咧...

继续来分享下之前的面经~欢迎友好讨论，信息共享1.什么是大语言模型的涌现能力？目前对该现象的研究有哪些发现？2.什么是 Embedding？词嵌入和句嵌入有何不同？3.大语言模型中的 Tokenization 是如何工作的？不同模型的分词算法有何差异？4.简述大语言模型中的 Prompt Engineering 技巧，如何设计有效的提示词提升模型输出质量？5.对比 Zero-Shot、Few-Shot 和 In-Context Learning，它们在大语言模型中的应用场景和局限性分别是什么？6.什么是 LoRA？它在大语言模型微调中的优势和原理是什么？7.大语言模型的 RLHF 训练流程是什么？它存在哪些潜在风险？8.介绍一下大语言模型中的知识蒸馏，它如何用于压缩模型体积？9.DeepSeek 优化了哪些？为什么不用 PPO，而是用 GRPO？10.对比大语言模型的增量推理和传统推理方式，增量推理的优势和实现难点是什么？11.大语言模型在推理时出现幻觉现象的原因是什么？有哪些缓解方法？12.大语言模型的长文本处理能力有限，目前有哪些技术可以缓解这一问题？13.什么是大语言模型的上下文窗口？扩展上下文窗口对模型性能有何影响？14.目前多模态大语言模型是如何融合文本与图像信息的？15.如何评估大语言模型的性能？常见的评测指标和基准数据集有哪些？16.单个 LLM 能否帮助用户完成完整行程规划，比如从出行到酒店都订好票？

点赞评论收藏

分享

03-05 13:55

门头沟学院内容运营

以为是做算法，其实偏工程？AI语音大模型服务端研发岗位解析

在 AI 行业中，语音不像纯文本那样“看得见”，但一旦出现延迟、卡顿、识别错误诸类问题，用户马上就能感知。避免这些问题的发生，即是语音大模型研发岗的职责。一天一个AI岗位介绍，今天拆解的岗位是：AI语音大模型服务端研发工程师。一句话总结就是：让语音大模型在真实企业场景里，稳定、低延迟、可规模化运行。不是做模型论文，也不是只写接口，而是将 ASR、TTS、大模型推理服务跑在企业客户的业务系统里。一、这个岗位到底在做什么？JD 可以拆成三条主线：架构搭建、模型工程化、ToB 场景落地。1️⃣ 语音 AI 服务架构设计（核心工程）这部分的关键词是：高并发、低延迟、稳定性、分布式你要搭建的是：企业级语...

点赞评论收藏

分享

03-04 12:53

门头沟学院机器学习

字节大模型算法二面难死了...

祝大家都能拿到满意的Offer！1. 项目拷打2. 详细阐述Transformer的底层原理，并说明其能够替代RNN的核心优势；结合Transformer架构的成熟度，分析Self-Attention机制在多模态对齐任务中是否存在瓶颈，以及在实际业务场景中，是否出现过注意力权重完全偏移的情况。3. 讲解LoRA的技术原理，说明LoRA是否仅能嵌入Linear层；分析LoRA无法在LayerNorm层之后插入的原因，以及该操作会对模型训练稳定性产生哪些具体影响。4. 结合实操经验，说明QLoRA降低训练资源成本的核心逻辑；列举常见的模型量化方式，并解释QLoRA选择NF4与FP16组合而非其他方案的原因，阐述NF4的分布拟合逻辑。5. 针对采用multi-query attention优化后，decoder延迟仍居高不下的问题，分析潜在性能瓶颈；探讨vLLM自带的KV Cache是否会成为推理过程中的负担。6. 分别说明Embedding模型与Rerank模型处理文本语料的核心流程，并结合实际应用场景举例说明。7. 结合过往RAG项目经验，讲解从数据清洗到检索服务上线的完整链路搭建流程，重点说明chunk切分的具体策略。8. 分析当前RAG技术落地的最大瓶颈，并阐述你在项目中采取过哪些优化手段来提升检索召回率（Recall）。9. 针对XX领域大模型的训练工作，说明SFT（监督微调）数据集的构造方法与核心思路。10. 结合LoRA微调实操经历，说明rank值的选择依据；在合并adapter权重的过程中，是否遇到过梯度爆炸问题，以及对应的解决方法。11. 结合你的模型部署相关经验，说明模型参数量与硬件算力需求之间的对应关系（例如不同参数量级模型所需的算力配置标准）；以部署一个稀疏率千分之三的235B参数量MOE架构模型为例，估算其所需的算力规模。12. 在搭建RAG知识库时，若需对文档进行动态更新，你采用的是全量嵌入还是增量处理方案？若为增量处理，如何规避新旧文档数据分布不一致导致的检索偏差问题。13. 针对机械臂动作态融合相关工作，说明数据融合的具体实现方案，以及对比实验的设计思路与评估指标。

查看12道真题和解析

点赞评论收藏

分享

02-25 19:56

字节跳动_TT图文_研发(实习员工)

再战27暑期实习！！懂车帝Agent架构一面

自我介绍实习经历介绍（这里就不详细展开，因为每个人不同，下面会记录一些闻到的通用的场景题）做一个开放平台需要有哪些模块开放平台的鉴权如何做，有没有了解过OAuth2开放平台的网关能做一些什么事情KV数据库的选型怎么考虑如何设计一个秒杀系统热点行更新是具体怎么做的对 AI 了解到什么程度为什么想要做Agent相关的工作飞书的MCP工具是如何写的你的AI coding的经验有哪些（因为给面试官说AI代码覆盖率到90%+，所以问了很多）如果做一个通用Memory的功能未来如何打算无算法题

查看12道真题和解析

点赞评论收藏

分享

评论

3

7

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 你感受到金三银四了嘛？ #

29790次浏览 315人参与

# 25届网易互娱暑实进度 #

99002次浏览 768人参与

# 今天你投了哪些公司？ #

51390次浏览 1104人参与

# 26届的你们有几段实习？ #

169834次浏览 1099人参与

# 春招 / 实习投递，你最焦虑的一件事 #

28735次浏览 642人参与

# 米哈游笔试 #

537519次浏览 981人参与

# Tplink求职进展汇总 #

206226次浏览 948人参与

# 虽然0面试，但今天___，夸夸自己 #

2490次浏览 74人参与

# AI项目实战 #

2580次浏览 122人参与

# 为了实习逃课值吗？ #

69034次浏览 536人参与

# 如果给AI员工评绩效，我的答案是…… #

4105次浏览 98人参与

# HR问：你期望的薪资是多少？如何回答 #

82843次浏览 711人参与

# 今年找实习到底有多难？ #

8859次浏览 95人参与

# 27届求职交流 #

42033次浏览 858人参与

# 大城市找工作会更容易吗 #

61941次浏览 390人参与

# 哪一刻你对工作祛魅了？ #

9324次浏览 102人参与

# 找工作，你都让AI帮你做什么？ #

2574次浏览 104人参与

# AI时代下，你的岗位要求有什么变化？ #

4578次浏览 99人参与

# 26届求职交流 #

21653次浏览 536人参与

# 签约/解约注意事项 #

887074次浏览 4713人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务