多模态算法实习一面-小红书
继续来分享下之前的面经~欢迎友好讨论,信息共享
1.如何构建高质量预训练数据?如何用LLM进行数据合成?Self-instruct与RLAIF的区别?如何避免模型自我强化偏见?
2.如果你负责设计一个千亿级MoE模型:如何设计并行策略?如何控制通信成本?3.如何做RLHF阶段的稳定训练?PPO在RLHF中的核心不稳定点?
4.如果训练中出现:GPU利用率低、显存碎片化严重,你会如何排查与优化?
5.RLHF训练中,奖励模型(RM)的训练难点是什么?如何避免奖励模型过拟合,确保其能准确反映人类偏好?
6.数据清洗过程中,如何区分有效数据与噪声数据?针对不同类型的噪声(如文本错误、图像模糊),有哪些针对性的处理方法?
7.在大模型训练过程中,如何优化显存占用和训练速度?
8.你在过往项目中,有没有基于业务需求,提出过创新的技术方案或优化思路?如何推动方案落地并验证效果?
9.代码题:合并两个有序链表和二叉树中的最大路径和
1.如何构建高质量预训练数据?如何用LLM进行数据合成?Self-instruct与RLAIF的区别?如何避免模型自我强化偏见?
2.如果你负责设计一个千亿级MoE模型:如何设计并行策略?如何控制通信成本?3.如何做RLHF阶段的稳定训练?PPO在RLHF中的核心不稳定点?
4.如果训练中出现:GPU利用率低、显存碎片化严重,你会如何排查与优化?
5.RLHF训练中,奖励模型(RM)的训练难点是什么?如何避免奖励模型过拟合,确保其能准确反映人类偏好?
6.数据清洗过程中,如何区分有效数据与噪声数据?针对不同类型的噪声(如文本错误、图像模糊),有哪些针对性的处理方法?
7.在大模型训练过程中,如何优化显存占用和训练速度?
8.你在过往项目中,有没有基于业务需求,提出过创新的技术方案或优化思路?如何推动方案落地并验证效果?
9.代码题:合并两个有序链表和二叉树中的最大路径和
全部评论
相关推荐
03-21 10:05
香港大学 产品经理 点赞 评论 收藏
分享
查看17道真题和解析 点赞 评论 收藏
分享
iiooz:别想太多了,面试官如果看不上,就不会约面了,腾讯很少所谓的kpi,有面就说明能力肯定不错,只是每个面试官筛选方式不同,二面甚至只跟你聊生活的都有,鹅还是很开放的在筛选人这一块 点赞 评论 收藏
分享