阿里国际AI算法面经

一、自我介绍
二、实习相关八股
1. 实习业务场景
负责大模型对话对齐、指令微调、强化学习优化,提升模型生成准确性、合规性与指令遵循度,落地垂类对话/问答业务。
2. SFT数据筛选、采样及处理
3. 选择GRPO的原因、优化目标及数学原理
- 选型原因:相比PPO显存占用低、无需价值网络、训练更稳定,对齐效率高
- 优化目标:最大化模型生成优势,约束KL散度防止策略突变
- 原理:分组优势归一化、截断策略比率、近端约束,降低训练方差
4. 奖励函数设计(重点)
围绕有用性、准确性、合规性、流畅性设计,分维度打分;加入KL惩罚,避免单一奖励过拟合,区分正负奖励权重。
5. 判断RL训练质量达标方法
- 奖励值收敛、KL散度稳定;
- 离线评测:指令遵循率、幻觉率达标;
- 人工抽检生成内容,无退化、无套路化输出
6. 是否遇到Reward Hacking
遇到过,模型生成空洞话术、固定模板刻意刷高奖励值。
7. 其他奖励作弊类型
刻意迎合奖励规则、答非所问、重复安全话术、回避核心问题、策略坍缩同质化输出。
8. PPO和DPO了解
- PPO:在线强化学习,近端策略优化,带价值网络,训练复杂度高
- DPO:离线偏好优化,基于成对偏好数据,无需交互采样,训练简单稳定
三、基础八股
1. Attention计算时间复杂度
标准自注意力:O(n²d)(n为序列长度,d为特征维度)
2. KV Cache原理
推理时缓存历史token的KV矩阵,避免重复计算,降低算力开销,提升推理速度。
3. GQA、MLA原理
- GQA:分组查询注意力,Q分组共享KV,平衡推理速度与效果
- MLA:融合局部+全局注意力,适配长上下文,降低显存占用
4. vLLM原理
基于PagedAttention分页管理KV Cache,提升显存利用率,支持高并发推理。
5. Flash Attention原理
分块计算注意力,优化显存IO,减少HBM访问,提速同时降低显存开销。
6. 稀疏注意力原理
仅计算局部/关联token注意力,舍弃全局无关token,将复杂度降至O(n),适配长文本。
7. 模型推理慢排查思路
检查序列长度、batch大小;确认KV Cache、量化、FlashAttention开启;排查GPU显存、算子优化问题。
四、编程题
1. rand7()实现rand10()
拒绝采样:rand7()*rand7()生成1-49数,保留1-40,映射为1-10,超出则重新生成。
2. 浮点数组取整最小变化和
贪心思路:每个数选上/下取整中差值更小的,累加最小总误差。
3. 最长无重复子串
全部评论
GRPO问得真细,佬强
点赞 回复 分享
发布于 05-15 15:52 北京

相关推荐

bg:双九,无实习论文,3月底开始投递,后端+AI应用一起投,前后面了20+场(致敬传奇耐面王),大多约面的还是后端,最后选择美团。现在想起来中间一直被一面挂后一度陷入自我怀疑,每天刷着xhs帖子更是焦虑到睡不着,第二天又总是莫名其妙惊醒,第一次真切地感受到身心俱疲。但是个人还是属于情绪较为稳定的,一直默默给自己洗脑,一定会收获offer的,中途也根据自己和别人的面经进行查漏补缺,不断对项目进行改进优化,最终也是成为团子孝子了。接下来,休息几天,准备入职后再提升一下自己备战秋招了。---时间线如下:1. 腾讯(后台开发):也是快集齐腾子所有群组了- 4.9 WXG 微信支付一面挂- 4.14 PCG QQ一面挂- 4.20 CSIG 腾讯云一面挂- 4.27 CSIG 腾讯云一面挂- 5.9 WXG 技术架构团队一面挂- 5.13 TEG 云架构平台部一面挂(面试开始直接做了两道非hot100,第二题差一点思路,然后面试官剩下时间基本上都是问我思路,然后如何优化,最后也是没怎么问项目和八股就结束了,唉,还是太菜了)2. 京东(后端)- 4.10 京东科技一面挂- 5.9 京东物流一面过(最不可思议的一集,因为面试当天正好是五一调休,面试官似乎很不乐意面试,问的也几乎是深度学习、大模型相关的问题)- 5.12 京东物流二面(五一调整面试流程后似乎直接是HRBP面)挂3. 美团(软开后端方向)- 4.1 AI面试- 4.11 笔试- 4.14 美团财务平台一面挂- 4.16 美团金服一面挂(感觉面试过程挺正常的,问题基本也回答上来了,可能横向了快一周后挂了吧)- 4.24 美团核心本地商业-基研一面,4.27约二面- 4.28 美团核心本地商业-基研二面,(面试官人挺好,基本上是各种层面的交流,甚至问了我高考排名,持续75mins。当晚约三面)- 4.30 美团核心本地商业-基研HRBP面- 5.14 二面面试官电话oc- 5.18 offer4. 阿里(JAVA和AI应用研发)- 4.11 笔试- 4.13 阿里云技术线一面挂- 4.20 飞猪一面挂- 4.22 阿里国际AI应用研发一面挂- 5.14 阿里云CIO线一面挂5. 字节(后端开发)- 4.15 Tik Tok Shop一面挂- 5.7 治理与体验一面挂- 5.18 推荐引擎平台拒面6. TME- 5.11 酷狗音乐一面,1.5小时后约二面- 5.12 酷狗音乐二面挂7. 招银科技- 4.16 AI面- 4.22 一面- 5.7 二面8. TP-LINK普联- 4.29 一面- 5.9 二面9. 得物- 4.26 笔试- 5.7 AI面试10. 美的- 5.8 笔试- 5.10 AI面试11. OPPO- 4.3 测评后无后续12. 蚂蚁集团- 3.28 笔试- 4.2 AI coding- 4.13 电话面挂13. 携程- 4.12 笔试14. 华为- 4.15 机考过暂未约面15. 剩下的基本都是简历挂:快手、联想、拼多多笔试挂、百度、小红书、小米、滴滴---###### 总结1. 虽然基本都是后端岗,但是还是有挺多AI相关的问题,可能是简历上写了Agent项目,还可能会问一下AI coding的心得、如何code review等之类的问题;2. 由于以前没有面试经验,所以感受没有对照组,都说手撕变少了,但是我基本上面过的腾讯、字节、阿里、美团仍然有手撕,腾讯基本是两道题,美团、字节几乎都是leetcode hot100,其他的几家不一定。3. 部分企业有AI coding,比如蚂蚁、美团,面试也会问使用AI的思路。
我的求职进度条
点赞 评论 收藏
分享
评论
2
7
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务