智谱实习大模型-算法一面

面试很难,还是要多多练习,感觉自己说不明白业务逻辑
1.项目拷打
2.实习经历介绍
3.LoRa
4.显卡资源如何,如何解决资源不足的问题
5.效果如何测评
6.有没有测常见的 benchmark
7.详细介绍快手实习
8.论文介绍
9.DeepSpeed zero 策略
10.除了 zero 外还有没有其他策略,也就是 offload 和 infinity
11.batchnorm 和 layer norm 的区别,主要是 batchnorm 和 dropout
12.model.train() 和 model.eval()的区别
13.dropout 测试时如何使用的
14.Coding1:买卖股票的最佳时机
15.Coding2:字母异位词分组
13.Coding3:盛最多水的容器
全部评论
给我多多一个机会 看我主页投一个
点赞 回复 分享
发布于 昨天 20:29 上海

相关推荐

评论
1
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务