腾讯LLM算法二面-暑期实习

整体面试还是不错的,但是没后续了,不知道是哪里出了问题
1. 项目拷打
2. 介绍Attention,从数学角度解释一下为啥注意除以\sqrt{d_k}?
3. Agent多轮对话中有哪些难点
4. SFT数据集构建策略
5. 介绍DPO、GRPO、PPO区别
6. 如果评估RAG,评估RAG是否work
7. 说一下大模型全参数微调的显存计算?说一下SMoE怎么推理的?相比于稠密模型有什么优点?
8. 最近看了什么论文和技术报告?推荐算法和大模型有什么地方可以结合呢?
9. 手撕:搜索排序数组
全部评论
好八股 大佬要不要考虑我司 详情见我主页帖子
点赞 回复 分享
发布于 昨天 21:44 上海
Attention 除以 sqrt (d_k) 和 SMoE 推理的问题我也在准备,蹲个大佬解答💡
点赞 回复 分享
发布于 昨天 14:03 陕西
感谢楼主分享腾讯 LLM 面经!这些问题太硬核了,备战算法岗很有用👍
点赞 回复 分享
发布于 昨天 14:02 北京

相关推荐

评论
点赞
1
分享

创作者周榜

更多
正在热议
更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务