美团北斗大模型校招算法一面

1.八股:LoRA 微调原理?训练时调过哪些超参数?有什么经验?
2.八股:SFT 的 loss 如何只计算回答部分?(如何 ignore padding token?)
3.八股:Attention 计算中有哪些显存优化策略?(如 KV Cache 复用、batch 拼接)
4.八股:分布式训练中 Zero-2 和 Zero-3 的核心区别是什么?
5.八股:Transformer 为什么用 LayerNorm 而不是 BatchNorm?
6.项目:项目中的数据规模多大?SFT 数据是如何清洗和构建的?
7.项目:为什么在项目中选择 GRPO 而不是 PPO 或 DPO?它解决了什么问题?
8.项目:奖励函数是如何设计的?是否考虑了事实正确性、安全性等维度?
9.项目:为什么引入 RAG?在什么场景下 RAG 比纯 SFT 更有效?
10.项目:用 LangGraph 实现多轮对话 Agent,相比手写 prompt 流程有哪些工程和效果优势?
11.代码题:lc102 二叉树的层序遍历
全部评论

相关推荐

部门是到家相关(拼好饭神券包医药等)底层技术支持,确实要求比较高一些4.14一面拷打点评1. 下单后还是支付后生成订单2. 如果消息队列没处理到信息用户就完成了支付呢3. 缓存如果运营活动开始前临时修改了配置怎么办4. 怎么评估kafka是否匹配当前流量场景5. 怎么调整分区数消费者数来应对高流量6. 怎么大致评估需要多少分区(除了压测)八股1. 线程池参数2. 线程池创建流程(任务执行流程)3. MySQL索引,表+5个sql判断使用索引的方式,最左匹配,覆盖索引手撕-三数之和4.17二面实习os1. 进程线程2. 孤儿进程3. 进程通讯方式4. 用户态内核态5. 死锁条件6. 怎么检测解除死锁7. epoll性能永远高于poll吗?8. 虚拟内存9. 分页分段10. 页面置换swap的几个算法11. 最优置换算法12. 如何评估算法好坏redis1. 为什么zset用skiplist不用b+树2. 为什么快3. string类型底层优化4. 数据持久化5. aof先命令还是先日志6. aof重写7. 内存淘汰计网1. ping是什么协议2. 在哪一层3. tcp可靠性4. 如何判断数据是否损坏5. timewait是什么怎么出现6. 大量的timewait有什么问题mysql1. b+树索引2. 能否无上限加索引3. 怎么判断索引好坏java1. copyonwritearraylist2. 线程池依据什么参数怎么调整jvm1. 怎么判断是垃圾?2. 引用计数法完全不能用吗?无手撕,一道aicoding
发面经攒人品
点赞 评论 收藏
分享
评论
3
6
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务