小米多模态算法面经-一面
1、对多模态大模型的了解
2、目前的文生图、图生图的方法?
3、目前的图像或者视频编码器?
4、vit的大概原理
5、文本编码器?
6、目标检测iou计算代码
7、对chatgpt的了解
8、transformer结构介绍
9、transformer中encoder和decoder的区别
10、clip代码(面试过程有提到自己了解clip)
2、目前的文生图、图生图的方法?
3、目前的图像或者视频编码器?
4、vit的大概原理
5、文本编码器?
6、目标检测iou计算代码
7、对chatgpt的了解
8、transformer结构介绍
9、transformer中encoder和decoder的区别
10、clip代码(面试过程有提到自己了解clip)
全部评论
佬,求个timeline
实习还是春招呀
佬,算法题难吗,问的啥
请问下,多模态大模型是指哪些?这些我平常只是听到,但是不知道是大模型指大语言模型和扩散Diffusion的生图模型
相关推荐
05-28 15:01
Durham University 数据分析师 点赞 评论 收藏
分享
查看40道真题和解析