成就我的未来

02-09 13:00 中南大学算法工程师

关注

字节多模态算法凉经，不知道为啥挂了...

1.实习介绍
2.防止 sft 灾难性遗忘你有哪些方法？
3.sft 和 rl 区别是什么？数据格式有什么区别？
4.Reasoning 推理过程有做什么 rl 吗？有哪些奖励？
5.rl 有哪些算法？reward 常见的有哪些任务？
6.为什么现在不用 reward model？区别是什么？
7.PPO 模块介绍一下，公式说一下？critical model 什么作用？
8.DPO 公式介绍一下，和 sft 有什么区别？
9.GRPO 少了哪些模块，如何在 GRPO 基础上防止模型波动？
10.介绍位置编码，PE、ROPE，现在常用哪些？为什么现在模型上下文只到 128K，如果是你你会做哪些改进？
11.高效推理了解过吗？如何做到高效推理？你知道哪些方法？
12.Lora 是什么？初始化讲一下？是否能对换？还有哪些变体？
13.KL散度作用是什么？推一下公式。如果是确定标签，那会有什么变化？从数学原理解释
13.编辑距离，用 n 的空间复杂度，如果我要打印编辑路径，你会怎么改，在哪个地方改？
基本全答上来了，手撕也很快，实在不知道为什么挂了

全部评论

推荐最新楼层

认真的火龙果在看面经

西安电子科技大学算法工程师

感觉年前kpi面

点赞回复分享

发布于 02-09 16:20 河南

03-16 19:00

同济大学算法工程师

蔚来大模型强化学习训练一面

📍面试公司：蔚来🕐面试时间：2026.03.16💻面试岗位：大语言模型强化学习算法实习生❓面试问题：自我介绍项目经历1，拷打项目动机，方法细节，评测方式，遇到的难点和解决方式，提出的方法为什么有效强化学习算法理论基础，介绍PPO算法，算法计算公式，优点，训练流程，介绍GRPO算法，特点，优势有关强化学习算法的代码库，TRL，VERL，Ray等询问对于Agentic RL 的认识，其中可能存在的难点，答了算法侧的稀疏奖励问题和工程实现上各类工具的稳定性编程题，word1->word2的最小操作次数🙌面试感想：自我介绍吟唱时间太长，适当压缩为教育背景，研究背景，项目/实习经历的简单介...

查看7道真题和解析

点赞评论收藏

分享

03-16 23:25

门头沟学院机器学习

字节日常实习大模型算法二面

有面试过同岗的朋友欢迎评论区交流1.深挖多模态和大模型的论文2.Decoder文本生成有哪几种方法3.还知道哪些多模态大模型4.介绍一下ALBEF、BLIP5.BLIP2的结构是什么 两阶段怎么训练的 有哪些损失6.知道PEFT吗 讲一下LoRA7.还有什么微调方法 -> prefix-tuning和P-tuning 两者分别是怎么做的 为了解决什么提出的

点赞评论收藏

分享

03-18 01:20

门头沟学院推荐算法

字节多模态大模型二面日常实习

攒攒人品！有面试过同岗的朋友欢迎评论区交流1.项目拷打2.论文拷打3.介绍transformer 架构4.BLIP2的结构是什么，两阶段怎么训练的，有哪些损失5.知道 PEFT 吗，讲一下 LoRA6.LoRA 是什么，有什么好处7.Transformer 怎么做加速训练，训练和推理有什么区别8.一些场景题

查看7道真题和解析

点赞评论收藏

分享

03-25 09:35

门头沟学院推荐算法

字节番茄大模型算法实习一面面经

发一下问题给大家参考，攒攒人品！1.项目拷打2.实习拷打3.论文拷打4.你更希望找长期实习，那你觉得什么样的工作内容会让你更愿意一直做下去？5.在xx那段主要是做数学解题这个方向，这个事情当时业务上是要解决什么问题？6.一开始为什么是用OCR加文本这种方案？后面为什么觉得不太够用了？7.你们后来换成多模态，是在哪些场景下收益最明显？8.你做的那一整套训练流程，对最终效果提升最大的是哪一块？9.模糊图效果提升挺多的，这块你觉得主要解决了什么问题？10.你们在数据这块做了很多处理，比如去重这些，这些工作你觉得值不值？有没有量化过收益？11.在强化学习这块具体是负责哪一部分？12.奖励大概是怎么定义的？有没有遇到奖励不合理的情况？13.强化学习训练过程中，有没有出现模型“学歪了”的情况？是怎么处理的？14.在xx公司那段用的是GRPO，当时为什么会选这个方法？15.小模型能做到80%以上这个效果，你觉得核心原因是什么？16.在比赛里做的是Agent推荐，这个和传统推荐最大的区别是什么？17.多代理那套方案里，哪一部分是你觉得最关键的？18.做了memory，这个东西实际带来的提升是什么？19.对现在这种Agent框架，比如OpenClaw，整体怎么看？20.如果让你用OpenClaw去做一个发券或者运营自动化，你第一步会怎么设计？21.你觉得这种Agent在业务里最大的风险点是什么？

查看21道真题和解析

点赞评论收藏

分享

03-18 02:25

门头沟学院推荐算法

多模态大模型面经分享-字节

面试很难，还是要多多练习，感觉自己说不明白业务逻辑1.项目拷打2.讲一下你用的大模型是什么结构，特征是怎么喂给大模型的3.讲一下multi-head attention，用pytorch手撕一下，要可以实现cross attention的4.大模型训练为什么不用SFT5.知道RLHF吗，讲一下训练流程6.问了几个电商相关的场景题，用大模型解决 prompt 应该怎么设计，怎么处理prompt的输出，怎么过滤错误格式的输出

查看5道真题和解析

点赞评论收藏

分享

评论

点赞

2

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 你觉得大几开始实习最合适？ #

11870次浏览 121人参与

# 你都用vibe coding做过什么？ #

6497次浏览 237人参与

# 厦门银行科技岗值不值得投 #

13068次浏览 308人参与

# 面试被问到不会的问题，你怎么应对？ #

10302次浏览 90人参与

# 你现在一天AI几次？ #

5169次浏览 70人参与

# 你见过哪些招聘隐形歧视？ #

8603次浏览 76人参与

# 招商银行数字金融训练营 #

69670次浏览 801人参与

# Vibe Coding 会干掉初级岗位吗？ #

9965次浏览 142人参与

# AI Coding实战技巧 #

3561次浏览 95人参与

# 做完笔试后你收到面试了吗？ #

11025次浏览 102人参与

# 大厂实习和小厂实习最大的区别是什么？ #

20566次浏览 152人参与

# 如果人生可以debug你会改哪一行? #

4561次浏览 86人参与

# 牛友の3月总结 #

14802次浏览 135人参与

# 秋招OC许愿 #

425019次浏览 2705人参与

# 金融财经春招备战日记 #

60757次浏览 253人参与

# 面试中，你被问过哪些奇葩问题？ #

91723次浏览 856人参与

# uu们，春招你还来吗？ #

51662次浏览 252人参与

# 面试吐槽bot #

182850次浏览 874人参与

# 节后第一天上班，我的精神状态 #

19922次浏览 139人参与

# 降低公积金和取消房补怎么选 #

29626次浏览 90人参与

# 七猫笔试 #

6089次浏览 40人参与

# Claude Code泄露源码 #

3601次浏览 53人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务