减肥 flag 常立常倒选手

昨天 07:40 门头沟学院人工智能

关注

算法实习面经-小红书多模态一面

继续来分享下之前的面经~欢迎友好讨论，信息共享
1.如何构建高质量预训练数据？如何用LLM进行数据合成？Self-instruct与RLAIF的区别？如何避免模型自我强化偏见？
2.如果你负责设计一个千亿级MoE模型：如何设计并行策略？如何控制通信成本？3.如何做RLHF阶段的稳定训练？PPO在RLHF中的核心不稳定点？
4.如果训练中出现：GPU利用率低、显存碎片化严重，你会如何排查与优化？
5.RLHF训练中，奖励模型（RM）的训练难点是什么？如何避免奖励模型过拟合，确保其能准确反映人类偏好？
6.数据清洗过程中，如何区分有效数据与噪声数据？针对不同类型的噪声（如文本错误、图像模糊），有哪些针对性的处理方法？
7.在大模型训练过程中，如何优化显存占用和训练速度？
8.你在过往项目中，有没有基于业务需求，提出过创新的技术方案或优化思路？如何推动方案落地并验证效果？
9.代码题：合并两个有序链表和二叉树中的最大路径和

全部评论

推荐最新楼层

03-04 22:29

门头沟学院算法工程师

影石多模态大模型算法工程师一面面经攒人品

社招第一次面试手撕了这么多代码.....太硬核了！基操：项目做的是什么？你训练算法过程中一般用哪些损失函数？中途插入问题：qwenvl系列的模块设计由哪些部分组成？然后就直接开始手撕代码了：多模态输入、Token 处理、Self/Cross Attention、Mask、LoRA、Dataset/DataLoader、训练流程、累计梯度、eval、多进程通信、微调方法 全都要会写代码。多模态大模型算法岗 · 高频面试题 + 标准答案（完整版）1. 多模态模型（图文）输入是怎么 Tokenize 的？答：文本用文本分词器转成文本 Token。图片不直接分词，而是切成固定大小的 Patch，每个 ...

查看20道真题和解析

点赞评论收藏

分享

03-07 04:25

门头沟学院推荐算法

阿里大模型校招面经俺不中咧...

继续来分享下之前的面经~欢迎友好讨论，信息共享1.什么是大语言模型的涌现能力？目前对该现象的研究有哪些发现？2.什么是 Embedding？词嵌入和句嵌入有何不同？3.大语言模型中的 Tokenization 是如何工作的？不同模型的分词算法有何差异？4.简述大语言模型中的 Prompt Engineering 技巧，如何设计有效的提示词提升模型输出质量？5.对比 Zero-Shot、Few-Shot 和 In-Context Learning，它们在大语言模型中的应用场景和局限性分别是什么？6.什么是 LoRA？它在大语言模型微调中的优势和原理是什么？7.大语言模型的 RLHF 训练流程是什么？它存在哪些潜在风险？8.介绍一下大语言模型中的知识蒸馏，它如何用于压缩模型体积？9.DeepSeek 优化了哪些？为什么不用 PPO，而是用 GRPO？10.对比大语言模型的增量推理和传统推理方式，增量推理的优势和实现难点是什么？11.大语言模型在推理时出现幻觉现象的原因是什么？有哪些缓解方法？12.大语言模型的长文本处理能力有限，目前有哪些技术可以缓解这一问题？13.什么是大语言模型的上下文窗口？扩展上下文窗口对模型性能有何影响？14.目前多模态大语言模型是如何融合文本与图像信息的？15.如何评估大语言模型的性能？常见的评测指标和基准数据集有哪些？16.单个 LLM 能否帮助用户完成完整行程规划，比如从出行到酒店都订好票？

点赞评论收藏

分享

03-04 19:15

门头沟学院机器学习

字节-Tiktok-推荐算法面经

继续来分享下之前的面经~欢迎友好讨论，信息共享1. 推荐系统基础链路是什么？你对哪一部分理解更为深入？2. 若让你在召回侧搭建数据看板，会如何设计？重点关注哪些指标？3. 简述冷启动的定义（本人仅答出大致概念，面试官仍持续追问）4. 追问：用户冷启动与视频冷启动的核心区别？5. 用户冷启动的常见问题及解决方案（此部分本人未完整作答）机器学习基础考点1. 梯度下降的定义2. 批量梯度下降与随机梯度下降的区别3. 常见的损失函数有哪些4. 模型评估指标、AUC的具体含义5. 数据不均衡问题的处理方法6. 是否了解大模型？（当前搜推领域大量应用生成式技术，为必考点）7. RankMixer原理介绍（字节面试高频必考知识点）代码手撕1. 分割等和子集2. 拓展提问：若数据中允许存在负数，代码应如何修改？

查看14道真题和解析

点赞评论收藏

分享

03-07 02:20

门头沟学院推荐算法

LLM算法实习百度二面面经

继续来分享下之前的面经~强度好大，俺不中咧。。。。1.实习中多智能体系统包含几个智能体？它们之间如何交互？2.意图识别模型需要识别多少个意图？3.750B 模型用于什么场景？4.实习中 Qwen3VL 模型是多少 B 的？用于什么场景？5.在实习中，你主要的贡献是什么？6.检索环节做了哪些优化？7.答案生成环节做了哪些优化？8.是否做了 SFT 或强化学习相关工作？在哪个环节做的？9.SFT 过程中是否对类别标签做了清洗或修正？10.强化学习的样本量是多少？11.基础模型经常分类分不准的案例有哪些？12.在校项目中，为什么用对话数据来增强数据集？13.在校项目任务的输出可以简单描述并举例吗？14.单智能体能否完成在校项目相关工作？为什么要使用多智能体？15.LangGraph 相对其他开源智能体编排工具的优点是什么？16.在现有场景中是否需要用到 LangGraph 的状态管理功能？17.如何理解 Long-term Memory 的实现方式？18.若将电商场景中用户的购买、点击、兴趣等信息设计为长期记忆，有什么想法？19.Context Window 能否储存大量电商交互信息？如何解决存储问题？20.推理时若将大量 Memory 以 Token 形式给到大模型，Token 长度过长该如何处理？21.强化学习有哪些常用技巧？22.若通过 SFT 进一步提升模型准确率，常用的手段有哪些？23.SFT 的理想数据量是多少？如何确定？24.SFT 数据分布一般怎么取？为什么选择该分布而非其他分布？

点赞评论收藏

分享

03-10 07:20

门头沟学院推荐算法

阿里大模型算法校招面经攒人品版

攒人品中，祝大家都能拿到满意的Offer！1.Transformer中Attention的本质是什么？你能从数学角度简要解释一下吗？2.在Agent多轮对话任务中，你觉得Attention的局限性体现在哪些方面？3.简要介绍一下SFT的核心流程，以及数据集的构建策略，SFT之后常见的Post-Training还有哪些？它们之间的目的有何区别？4.什么是RAG，它是怎么提升生成质量的？与传统检索＋模型生成的流程有何不同？如何评估一个RAG系统是否work的？5.PPO和DPO在大模型对齐中的主要区别是什么？DPO训练通常有哪些注意事项？用过GRPO么？6.项目里的Modular Agent，你能讲讲它是如何实现多步规划的吗？7.项目提到了多个工具调用链路，调度策略是如何设计的？是否有异常fallback策略？8.Agent评估体系包括哪些维度？如何衡量planning能力 vs hallucination rate？9.项目里微调Qwen，选择的训练阶段和Loss函数是如何决定的？10.Prompt自动推荐模块用了哪些优化策略？有没有尝试过Prompt压缩或embedding表示的方式？11.场景题：假如一个Agent 推理链路包含3个工具+高频请求，系统整体延迟较高，你会如何优化？12.代码：岛屿数量

查看11道真题和解析

点赞评论收藏

分享

评论

1

4

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 你感受到金三银四了嘛？ #

30098次浏览 317人参与

# 25届网易互娱暑实进度 #

99017次浏览 768人参与

# 今天你投了哪些公司？ #

52187次浏览 1116人参与

# 26届的你们有几段实习？ #

169854次浏览 1099人参与

# 春招 / 实习投递，你最焦虑的一件事 #

29039次浏览 649人参与

# 米哈游笔试 #

537587次浏览 981人参与

# Tplink求职进展汇总 #

206243次浏览 948人参与

# 虽然0面试，但今天___，夸夸自己 #

2507次浏览 74人参与

# AI项目实战 #

2616次浏览 123人参与

# 为了实习逃课值吗？ #

69049次浏览 536人参与

# 如果给AI员工评绩效，我的答案是…… #

4139次浏览 99人参与

# HR问：你期望的薪资是多少？如何回答 #

82858次浏览 711人参与

# 今年找实习到底有多难？ #

8892次浏览 95人参与

# 27届求职交流 #

42189次浏览 860人参与

# 大城市找工作会更容易吗 #

61956次浏览 390人参与

# 哪一刻你对工作祛魅了？ #

9426次浏览 102人参与

# 找工作，你都让AI帮你做什么？ #

2597次浏览 104人参与

# AI时代下，你的岗位要求有什么变化？ #

4604次浏览 99人参与

# 26届求职交流 #

21736次浏览 536人参与

# 签约/解约注意事项 #

887202次浏览 4713人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务