26校招美团北斗大模型算法二面

1.八股:bf16 和 float16 的区别?各占多少位?训练中如何选择?
2.八股:DeepSpeed Zero 各阶段分别做了哪些优化?
3.八股:如何估算 LLaMA-7B 模型推理时的显存占用?
4.八股:Prefix LM、Causal LM、Encoder-Decoder 三类架构的适用场景与优缺点?
5.八股:Qwen 或 DeepSeek 技术报告中提到的关键创新点有哪些?(如 RoPE 外推、MoE)
6.项目:PPO/GRPO 微调后,如何防止模型在分布外(OOD)问题上性能崩塌?
7.项目:是否自己实现过 RLHF 流程?不用框架能否手写 PPO 核心逻辑?
8.项目:模型部署用了什么框架(vLLM/TGI/自研)?如何优化推理延迟和吞吐?
9.项目:未来希望专注大模型哪个方向?(对齐 / 推理加速 / 长上下文?)为什么?
10.代码题:LeetCode 25:K 个一组翻转链表
全部评论
不愧是大模型,看着就不容易
点赞 回复 分享
发布于 01-13 16:04 广东
你这个手撕倒是挺简单的
点赞 回复 分享
发布于 2025-12-29 17:50 陕西

相关推荐

04-12 11:51
吉林大学 Java
1. 面试官介绍自己的团队,base位置,是否能够接受。2. 自我介绍3. 了解了一下我的现状,能够实习多久。4. 聊项目5. 你测试了你的系统吗?AI服务耗时怎么样?6. 你有调研过Java语言实现AI服务的工具吗?为什么项目中要用Python开发呢?7. 你的消息队列的主要作用是什么?8. 除了消息队列,你有没有想过其他通信方案?(RPC,HTTP等)9. 为什么不使用http同步调用的方案呢?10. 这个项目中,检索业务和生成业务的性能瓶颈你觉得在哪?有没有想过优化方案?11. 聊Java八股12. 你使用的JDK版本是什么?你了解过哪些新特性?13. 你用过lambda表达式吗?你知道lambda表达式底层的实现原理吗?14. 你了解过Java最新的绿色线程吗?15. 说说Java的虚拟线程和Go语言的协程、Python的协程有什么区别吗?(本人不了解Go和Java的虚拟线程,就只讲了Python的协程)16. 用普通的线程可以做到你项目中协程的工作吗?两种实现方案有什么区别?17. 你的项目用的是什么垃圾回收器?(回答是G1垃圾回收器)你了解G1垃圾回收器的底层原理吗?18. G1标记完需要回收的region后,具体如何判断是否该对一个region进行清理呢?19. 聊AI八股20. 你说你用了langchain和langgraph,介绍一下他们和二者的关系21. 你觉得langgraph真正的强大之处在哪?他有哪些关键的机制?22. 你知道langchain和langgraph框架在Java端的适配版本吗?有调研过吗?23. 你了解过向量数据库milvus的索引吗?24. 能简单讲讲向量的稠密索引是如何工作的吗?25. 你了解微调吗?Lora微调的原理是什么?与全量微调有何区别?26. 你了解vLLM吗?你知道他的原理吗?27. 你提到你使用了一些提示词工程,比如few shot和CoT,介绍一下他们以及具体的应用场景。28. 你的项目中如何应用提示词工程的?你怎么管理不同版本的提示词呢?29. 你了解哪些降低大模型幻觉的手段?30. 除了RAG,还有别的方法吗?31. 你的项目用了几个Agent?你的多个Agent之间如何通信?32. 你有没有考虑过Agent之间无限循环调用导致token消耗爆炸的情况?有没有解决方案或者思路?33. 你的项目中是如何计算和监控token消耗量的?34. 你了解哪些Agent通信方法?算法题:高精度乘法反问面试体验比较好。虽然难度大但是也能了解到很多新知识,开阔视野。第二天进二面。
点赞 评论 收藏
分享
04-21 19:25
已编辑
蚌埠坦克学院 C++
1. 讲一下多路线程池的实现原理,怎么做线程同步?2. 生产者-消费者队列(有界队列)实例需要几个条件变量和锁来管理?(1个和2个都行,2个就是not_empty和not_full)3. 你提到无锁队列,讲一下实现方法?4. 为什么用atomic原子变量来实现无锁队列?了解atomic的底层原理吗,这样做会引入什么代价?5. 为什么atomic+自旋实现的无锁队列比有锁队列性能更优?6. 讲一下内存序有哪几种?分别有什么特性怎么使用?7. 为什么memory_order_acquire和memory_order_release 用于锁的获取和释放?8. 为什么要使用内存序?为什么执行顺序和代码顺序会出现不一致?9. 你提到编译器优化?还有其他原因吗?(CPU乱序,缓存一致性)10. 讲一下返回值优化?返回值优化的原理能展开说说吗?11. 讲一下你的解码帧内存池的实现原理和数据结构选型?12. 你提到你每个页设置的是64KB,为什么选这个大小?13. 如果你每个页拼接起来尾部有不足64KB的怎么办?(已经按公倍数选择了,解码帧分辨率都是64的倍数)14. 讲一下你为什么选LRU,假如你用来管理页的vector回收了一些页块回来,造成了外部碎片,该怎么处理?(伙伴算法+相邻页块合并)15. 聊聊webrtc和websocket的差异和优缺点,你认为他们分别适合什么样的业务场景,有什么优缺点?16. 手撕:跳跃游戏II
查看16道真题和解析
点赞 评论 收藏
分享
评论
1
4
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务