携程大模型算法 二面 实习面经

面试很难,还是要多多练习,感觉自己说不明白业务逻辑
1.问论文
2.项目深挖
3.attention结构
4.gpt12的结构
5.Llamma12的结构
6.Deepseekv2 v3 r1 r1 zero的结构和训练过程
7.探讨moe技术细节以及未来发展的困境
8.一道业务题
全部评论

相关推荐

评论
1
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务