实习字节大模型算法一面
给我面没招了,感觉面试好难,发点面经攒攒人品
1. 项目
2.讲讲DeepSpeed的理解
3.你为什么用zero3?
4.还用过哪些加速框架吗?有什么区别?推导一下显存节省公式。
5.内容理解怎么做?做过训练吗?如果训练一个chart story的模型,数据你会怎么构造
6.讲一下BLIP和BLIP2的区别,现在主流模型用什么?训练过吗
7.Q-former是什么?
8.手撕:leetcode 69 手写根号,有优化方法吗
1. 项目
2.讲讲DeepSpeed的理解
3.你为什么用zero3?
4.还用过哪些加速框架吗?有什么区别?推导一下显存节省公式。
5.内容理解怎么做?做过训练吗?如果训练一个chart story的模型,数据你会怎么构造
6.讲一下BLIP和BLIP2的区别,现在主流模型用什么?训练过吗
7.Q-former是什么?
8.手撕:leetcode 69 手写根号,有优化方法吗
全部评论
相关推荐
02-14 16:04
岭南师范学院 嵌入式工程师 点赞 评论 收藏
分享
曼迪匹艾公司福利 149人发布