Shopee多模态大模型一面(实习已oc)。

1时间:40分钟

2.问题:自己项目问题问略过。

熟悉vlm大模型吗?图像文本如何对齐。

attention注意力得分纬度,softmax为什么是dim=-1。

讲解gradient checkpoint理解。

讲解layernorm和rmsnorm的理解。

3.手撕:attention注意力。

rmsnorm。

总体而言要吃透自己的项目问题,以及大模型八股,速度很快,一面后不到2小时约二面。

全部评论

相关推荐

叁六玖:要是这个时候有人找你,你不炸了吗
点赞 评论 收藏
分享
评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务