阿里巴巴大模型算法一面-实习面经

1.实习经历穿插具体介绍
2.bceloss公式介绍用pe,优势在哪里
3.粗排有没有和精排有什么交互信息
4.序列建模的基线模型是什么
5.Linux常用命令有哪些,如何用Linux命令在两服务器间传数据
6、如何降低KV cache
7、讲讲DeepSeek中的MLA
8.讲讲最开始的自注意力机制发展到当今的一个优化路线
9.手撕最长公共子串
全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务