实习字节大模型算法一面
给我面没招了,感觉面试好难,发点面经攒攒人品
1. 项目
2.讲讲DeepSpeed的理解
3.你为什么用zero3?
4.还用过哪些加速框架吗?有什么区别?推导一下显存节省公式。
5.内容理解怎么做?做过训练吗?如果训练一个chart story的模型,数据你会怎么构造
6.讲一下BLIP和BLIP2的区别,现在主流模型用什么?训练过吗
7.Q-former是什么?
8.手撕:leetcode 69 手写根号,有优化方法吗
1. 项目
2.讲讲DeepSpeed的理解
3.你为什么用zero3?
4.还用过哪些加速框架吗?有什么区别?推导一下显存节省公式。
5.内容理解怎么做?做过训练吗?如果训练一个chart story的模型,数据你会怎么构造
6.讲一下BLIP和BLIP2的区别,现在主流模型用什么?训练过吗
7.Q-former是什么?
8.手撕:leetcode 69 手写根号,有优化方法吗
全部评论
相关推荐
点赞 评论 收藏
分享
02-13 18:45
山东大学 C++ 点赞 评论 收藏
分享
牛客99051572...:实习全是包装的吧?字节能给实习生这么多东西做?
点赞 评论 收藏
分享
点赞 评论 收藏
分享
