小米多模态算法面经-一面
1、对多模态大模型的了解
2、目前的文生图、图生图的方法?
3、目前的图像或者视频编码器?
4、vit的大概原理
5、文本编码器?
6、目标检测iou计算代码
7、对chatgpt的了解
8、transformer结构介绍
9、transformer中encoder和decoder的区别
10、clip代码(面试过程有提到自己了解clip)
2、目前的文生图、图生图的方法?
3、目前的图像或者视频编码器?
4、vit的大概原理
5、文本编码器?
6、目标检测iou计算代码
7、对chatgpt的了解
8、transformer结构介绍
9、transformer中encoder和decoder的区别
10、clip代码(面试过程有提到自己了解clip)
全部评论
佬,求个timeline
送花
回复
分享
请问下,多模态大模型是指哪些?这些我平常只是听到,但是不知道是大模型指大语言模型和扩散Diffusion的生图模型
送花
回复
分享
滴滴
官网直投
佬,算法题难吗,问的啥
送花
回复
分享
实习还是春招呀
送花
回复
分享
送花
回复
分享
相关推荐
点赞 评论 收藏
转发
点赞 评论 收藏
转发
点赞 评论 收藏
转发