淘天AI算法 暑期实习一面面经 100m
面试很难,还是要多多练习
AI coding笔试(30min
一些八股:
1.Attention的QKV怎么计算,WQ/WK/WV的形状
2.MOE的路由机制,稀疏vs稠密
3.KV Cache在prefill和decoding阶段的读写差异
4.大模型幻觉怎么规避
5.微调后出现复读机怎么排查
6.SFT够用 vs 必须上DPO/RL怎么判断
7.DPO损失函数的潜在问题
8.KL散度在模型对齐里的作用
9.接着问了google的TurboQuant kv cache
10.项目深挖
11.灾难性遗忘怎么解决等问题
AI coding笔试(30min
一些八股:
1.Attention的QKV怎么计算,WQ/WK/WV的形状
2.MOE的路由机制,稀疏vs稠密
3.KV Cache在prefill和decoding阶段的读写差异
4.大模型幻觉怎么规避
5.微调后出现复读机怎么排查
6.SFT够用 vs 必须上DPO/RL怎么判断
7.DPO损失函数的潜在问题
8.KL散度在模型对齐里的作用
9.接着问了google的TurboQuant kv cache
10.项目深挖
11.灾难性遗忘怎么解决等问题
全部评论
拼多多招27届实习生啦 https://careers.pddglobalhr.com/campus/intern/detail?t=dRvUVvcTiA
相关推荐
点赞 评论 收藏
分享
04-10 10:22
河南工业大学 软件测试 点赞 评论 收藏
分享
04-29 12:45
内蒙古大学创业学院 C++ bangbangba...:感觉三个项目可以融在一起,比如上层是用手写的epoll,然后到tcp聊天层,然后你写了一个后台监控(不过我也不懂c++,但是感觉写一个大项目比三个小项目要好)
点赞 评论 收藏
分享