03-19 13:35 门头沟学院推荐算法

关注

多模态算法实习一面-小红书

继续来分享下之前的面经~欢迎友好讨论，信息共享
1.如何构建高质量预训练数据？如何用LLM进行数据合成？Self-instruct与RLAIF的区别？如何避免模型自我强化偏见？
2.如果你负责设计一个千亿级MoE模型：如何设计并行策略？如何控制通信成本？3.如何做RLHF阶段的稳定训练？PPO在RLHF中的核心不稳定点？
4.如果训练中出现：GPU利用率低、显存碎片化严重，你会如何排查与优化？
5.RLHF训练中，奖励模型（RM）的训练难点是什么？如何避免奖励模型过拟合，确保其能准确反映人类偏好？
6.数据清洗过程中，如何区分有效数据与噪声数据？针对不同类型的噪声（如文本错误、图像模糊），有哪些针对性的处理方法？
7.在大模型训练过程中，如何优化显存占用和训练速度？
8.你在过往项目中，有没有基于业务需求，提出过创新的技术方案或优化思路？如何推动方案落地并验证效果？
9.代码题：合并两个有序链表和二叉树中的最大路径和

全部评论

推荐最新楼层

03-21 10:05

香港大学产品经理

求职记录-拒信

早上一睁眼，第一封就来了我并不觉得他说的事情我      做不了，难道是我太骄傲了吗？

求职季如何保持心态不崩

点赞评论收藏

分享

03-19 15:01

已编辑

同济大学算法工程师

百度大模型后训练一面

📍面试公司：百度 文心一言🕐面试时间：2026.03.18💻面试岗位：大模型RL后训练❓面试问题：自我介绍，教育背景，项目经历项目介绍，基于大语言模型的信号灯控制，问题是什么，如何结合熵，怎么评测，指标结果如何强化学习理论内容，trust-range和PPO的关系PPO是off-policy or on-policy? on-policy为什么会有importance sampling，采样的策略模型和要训练的策略模型有偏差，重要性采样加以修正PPO的clip在优势A 正/负时 限制上/下届，A为正限制上届，A为负限制下届PPO的损失函数怎么计算的？广义优势估计是怎么计算？GAE中lam...

查看17道真题和解析

点赞评论收藏

分享

03-18 14:40

门头沟学院推荐算法

小红书大模型算法实习面经

继续来分享下之前的面经~欢迎友好讨论，信息共享1. LLaMA 相比原始 Transformer 架构有哪些改进？2. 微调（Fine-tuning）和对齐（Alignment）的区别？3. 模型微调到什么程度才需要进行对齐？4. 四种对齐算法的区别：PPO、DPO、GRPO、DSPO？5. 位置编码的作用？为什么相对位置编码通常比绝对位置编码更好？6. GAE（Generalized Advantage Estimation）以及重要性采样（Importance Sampling）？7. 损失采样（Loss Sampling）相关问题？8. 目前了解哪些大模型架构？例如 LLaMA 等。9. 是否了解 PagedAttention？10. LoRA 中两个低秩矩阵是如何初始化的？11. PPO 中的四种模型分别是什么？各自的作用是什么？

查看11道真题和解析

点赞评论收藏

分享

03-20 20:31

同济大学算法工程师

百度 - 大模型后训练实习生二面

📍面试公司：百度 🕐面试时间：2026.03.20💻面试岗位：文心一言 后训练❓面试问题：自我介绍，教育背景，项目，和实习（两段本科Java web实习，没有后训练实习经验）GRPO训练的数据流KL散度的计算公式，怎么做平滑softmax的计算公式，怎么防止数值爆炸，有什么影响GRPO里的$\pi_\theta$, $\pi_\theta_{old}$, $\pi_\theta_{rollout}GRPO里是off-poliy/on-policy，当batch_size非常大时，如何缓解off-poliy的问题？平时使用vibing code的频率，以及使用的模型有哪些？了解TRL，VE...

查看13道真题和解析

点赞评论收藏

分享

03-16 17:04

快手_后端开发实习生(实习员工)

总时长35分钟，无手撕，感觉遇到KPI面了，唉35分钟一直在问实习，八股就问了下面的1.redis与数据库的缓存一致性2.redis的zset数据结构3.redis的两个持久化机制4.分布式cap理论5.什么时候ap，什么时候cp6.进程线程协程问怎么没手撕，说一面撕过了，业务是应用宝游戏商城，后面过了还有一面技术面，问面试表现，说挺顺的，可以再关注一下运维数据，然后问转go有难度嘛，就结束了

iiooz：别想太多了，面试官如果看不上，就不会约面了，腾讯很少所谓的kpi，有面就说明能力肯定不错，只是每个面试官筛选方式不同，二面甚至只跟你聊生活的都有，鹅还是很开放的在筛选人这一块

今天你投了哪些公司？

点赞评论收藏

分享

评论

点赞

1

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 春招至今，你的战绩如何？ #

10927次浏览 93人参与

# 你的实习产出是真实的还是包装的？ #

1939次浏览 42人参与

# 米连集团26产品管培生项目 #

6021次浏览 216人参与

# 军工所铁饭碗 vs 互联网高薪资，你会选谁 #

7623次浏览 43人参与

# 简历第一个项目做什么 #

31733次浏览 339人参与

# 重来一次，我还会选择这个专业吗 #

433525次浏览 3926人参与

# 巨人网络春招 #

11359次浏览 223人参与

# 当下环境，你会继续卷互联网，还是看其他行业机会 #

187188次浏览 1122人参与

# 牛客AI文生图 #

21445次浏览 238人参与

# 不考虑薪资和职业，你最想做什么工作呢？ #

152434次浏览 888人参与

# 研究所笔面经互助 #

118956次浏览 577人参与

# 简历中的项目经历要怎么写？ #

310336次浏览 4217人参与

# AI时代，哪些岗位最容易被淘汰 #

63781次浏览 826人参与

# 面试紧张时你会有什么表现？ #

30508次浏览 188人参与

# 你今年的平均薪资是多少？ #

213126次浏览 1039人参与

# 你怎么看待AI面试 #

180113次浏览 1258人参与

# 高学历就一定能找到好工作吗？ #

64331次浏览 620人参与

# 你最满意的offer薪资是哪家公司？ #

76532次浏览 374人参与

# 我的求职精神状态 #

448117次浏览 3129人参与

# 正在春招的你，也参与了去年秋招吗？ #

363485次浏览 2638人参与

# 腾讯音乐求职进展汇总 #

160670次浏览 1112人参与

# 校招笔试 #

471103次浏览 2964人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务