拼多多暑期实习二面

1. 介绍论文
2. Transformer结构
3. 注意力机制
4. 交叉熵
5. 实际微调采用怎么样的配置,如何选取合适的学习率、batch size等等
6. PPO(本来面试官想要深挖,但是我表示了自己不太擅长强化学习就没接着问了)
7. 注意力机制的优化有哪些(答:GQA、MLA、FlashAttn)
8. 算法题:模拟BPE的实现。追问有没有优化的方法(我写的太暴力了)。

面试官人很有耐心,一直在深入追问细节,意识到了自己很多不足的地方,感恩。
#发面经涨人品#
全部评论
感觉问的似乎不多呢
点赞 回复 分享
发布于 昨天 23:02 北京

相关推荐

03-24 17:57
门头沟学院 Java
yakuso:你这头像哈哈哈
点赞 评论 收藏
分享
评论
2
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务