腾讯多模态大模型算法实习二面 40min

1.最近有尝试什么新想法吗?有没有试过 vision encoder 的桥接。
2.ppu 是什么卡?自己有测试过性能和其他卡的对比吗?需要手写 cuda 吗
3.介绍一下多模态长视频扩展方法,如何在现有模型上改,比如 llava?
4.有考虑音频融合吗?新增一个音频模态你会怎么考虑?

5.手撕: 编辑距离
全部评论

相关推荐

查看10道真题和解析
点赞 评论 收藏
分享
评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务