腾讯多模态大模型算法实习二面 40min
1.最近有尝试什么新想法吗?有没有试过 vision encoder 的桥接。
2.ppu 是什么卡?自己有测试过性能和其他卡的对比吗?需要手写 cuda 吗
3.介绍一下多模态长视频扩展方法,如何在现有模型上改,比如 llava?
4.有考虑音频融合吗?新增一个音频模态你会怎么考虑?
5.手撕: 编辑距离
2.ppu 是什么卡?自己有测试过性能和其他卡的对比吗?需要手写 cuda 吗
3.介绍一下多模态长视频扩展方法,如何在现有模型上改,比如 llava?
4.有考虑音频融合吗?新增一个音频模态你会怎么考虑?
5.手撕: 编辑距离
全部评论
相关推荐
点赞 评论 收藏
分享
OPPO公司福利 1165人发布
查看7道真题和解析