实习字节大模型算法一面

给我面没招了,感觉面试好难,发点面经攒攒人品
1. 项目
2.讲讲DeepSpeed的理解
3.你为什么用zero3?
4.还用过哪些加速框架吗?有什么区别?推导一下显存节省公式。
5.内容理解怎么做?做过训练吗?如果训练一个chart story的模型,数据你会怎么构造
6.讲一下BLIP和BLIP2的区别,现在主流模型用什么?训练过吗
7.Q-former是什么?
8.手撕:leetcode 69 手写根号,有优化方法吗
全部评论

相关推荐

评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务