蚂蚁大模型一面(被问懵版

发一下问题给大家参考,攒攒人品!
1. PPO的原理?从维护的四个model讲,再详细讲一下训练流程和损失函数各个参数含义?
2. 为什么有了reward model还需要critic model?critic model作用是什么?
3. 交叉熵和kl散度的联系和区别?PPO的kl散度可以改成交叉熵吗?分类任务可以用KL散度吗?
4. GRPO的kl散度和PPO的kl散度区别?K1 K2 K3估计区别?
5. rollout数量 batchsize数量和计算资源(卡的数量)有什么关系?线性?非线性?
6. 真实采样数量一定等于rollout数量吗?
7. 提到了拒绝采样,详细讲一下
8. 你是怎么设计agent的记忆系统?
9. 长期记忆如何存储?如果历史记录量非常大,怎么优化查询效率?
10. 你们有没有用到类似AutoGen或LangChain的框架?为什么选这个框架?
11. vLLM框架是怎么做推理加速的?
全部评论

相关推荐

一、项目深挖从实习经历里挑一个最能体现技术能力、最有挑战的项目详细聊聊。这个功能整体研发大概多少人参与?在这个项目里压力最大、最棘手的事情是什么?你做了哪些重要的设计决策,这些决策带来了什么效果?更新数据库状态和推送不是原子操作,你当时是怎么权衡的?想保证这两个异步操作绝对一致性,有什么办法?延伸场景:先写数据库 A 再写数据库 B,要求同时成功 / 同时失败,怎么设计?项目用户量、QPS 大概多少?有出现客户投诉吗?功能上线后怎么验证、保证系统稳定?出现异常需要线上应急吗?你设置了哪些告警指标?从现在视角看,你会设置哪些指标观测系统稳定性?二、Full GC 问题排查介绍下当时遇到的 Full GC 问题,以及完整排查过程。三、AI & Web Coding 相关如果用 Web Coding 写这个系统,你会怎么设计提示词?AI 生成代码不可控,你怎么约束、确保符合预期?有没有试过用 Web Coding 写项目,过程中最大问题是什么?业界怎么解决 AI 思考慢、反复出错的问题?有没有考虑用 AI 做测试用例提效,做 TDD 开发?如果设计一个 AI 研发 + 测试的协作 team,怎么设计?研发 Agent 和测试 Agent 之间怎么交互,避免越改越偏?大模型上下文有限,Claude 类产品怎么保证长代码迭代不丢失注意力?四、职业规划 & 行业选择工作之后的职业规划是怎样的?想从事什么行业 / 业务场景,为什么?了解蚂蚁国际是做什么的吗,为什么投这个岗位?五、算法 & 限流(核心编程题)手撕实现滑动窗口限流(1 分钟级别)。单机限流会有什么问题?多线程场景下,单机限流是否还有效?扩展为集群全局限流,怎么调整逻辑?用 Redis 做全局限流,会选用哪种方案?
查看30道真题和解析
点赞 评论 收藏
分享
04-01 08:53
已编辑
门头沟学院 Java
1. 面试官介绍:QQ - 频道业务,社区产品,后台开发 && AI 开发;闲聊 QQ 产品发展史2. 自我介绍3. Redisson 分布式锁底层实现,对比红锁4. 锁误删什么情况会发生、怎么解决锁误删5. 锁续约怎么实现,底层原理6. AI 推荐后台采用 WebSocket 实时推送怎么实现的,为什么采用 WebSocket,为什么不采用长 HTTP 连接或其他的 RPC?7. WebSocket 和普通 HTTP 的区别,从原理角度考虑8. OAuth2 的原理,以及对比 JWT、Session 的区别9. 重定向是 304 吗?为什么不是 401?10. 访问一个网站 404 了,怎么定位这个问题?11. 一个 HTTP 请求,怎么走到前端的?12. 通过 goroutine 和 recover 实现异步操作日志是怎么实现的?为什么这样实现?13. 如果使用 Kafka 异步操作写库,写的时机是什么时候?是这些操作完了再写还是先写再操作?14. 异步不能保证审计不丢失,怎么处理?15. 怎么保证消息不丢失?16. 先写 Kafka,再执行业务操作,还是先执行业务再写 Kafka ?17. 如果写 MQ 失败,会不会堵塞业务,此时怎么处理?怎么保证服务高可用,同时保证审计的完整性?18. 审计的ID放在哪里?失败了怎么处理?给出一个方案能保证正常审计,包括写 Kafka 失败了怎么办?写完 Kafka 后续执行失败了怎么办?19. 定位审计是一个强约束还是非强约束,若是关键路径则不能绕过它,它失败则后续都失败,若不是强约束则不能作为审计,所以怎么样才能做到审计?20. 怎么保证审计日志写库的强一致性也保证业务的正常流程?假设用 MQ 而 MQ 挂了怎么办?因为写 MQ 也可能存在一定的失败,若 MQ 挂了业务也就挂了,这种极端情况怎么处理?全程无手撕,项目深挖+场景深挖,挖到不会为止许愿二面
查看19道真题和解析
点赞 评论 收藏
分享
评论
3
8
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务