阿里巴巴大模型算法一面 被拷打哭了
问的太细了不愧是阿里,给我面没招了...
1.项目拷打
2.bceloss公式介绍用pe,优势在哪里
3.粗排有没有和精排有什么交互信息
4.序列建模的基线模型是什么
5.Linux常用命令有哪些,如何用Linux命令在两服务器间传数据
6、如何降低KV cache
7、讲讲DeepSeek中的MLA
8.讲讲最开始的自注意力机制发展到当今的一个优化路线
9.手撕最长公共子串
1.项目拷打
2.bceloss公式介绍用pe,优势在哪里
3.粗排有没有和精排有什么交互信息
4.序列建模的基线模型是什么
5.Linux常用命令有哪些,如何用Linux命令在两服务器间传数据
6、如何降低KV cache
7、讲讲DeepSeek中的MLA
8.讲讲最开始的自注意力机制发展到当今的一个优化路线
9.手撕最长公共子串
全部评论
相关推荐
点赞 评论 收藏
分享

查看5道真题和解析