百度二面 大模型研发凉经
继续来分享下之前的面经~欢迎友好讨论,信息共享
1讨论项目
2什么是GAE
3解释deepseek的MLA,分析可能有什么缺点
4介绍deepseekV3.2的闪电索引器和可能的缺点
5介绍MHC残差连接
6什么是多头注意力
7口述两个算法题,说出求根号的多重方法(牛顿,梯度下降,二分),二分法求到小数点后k位精度算法复杂度
8一个哈希表题目,不是力扣
1讨论项目
2什么是GAE
3解释deepseek的MLA,分析可能有什么缺点
4介绍deepseekV3.2的闪电索引器和可能的缺点
5介绍MHC残差连接
6什么是多头注意力
7口述两个算法题,说出求根号的多重方法(牛顿,梯度下降,二分),二分法求到小数点后k位精度算法复杂度
8一个哈希表题目,不是力扣
全部评论
感谢分享!请问闪电索引器具体是怎么实现的?
相关推荐
03-12 21:53
南昌航空大学 Java 还是想躺平了:那就认清呗,按他们说的读研读博,爆着家里米然后边玩边学,考不上就再考一年反正花的家里钱,等他们被啃得受不了了来怪你,就说当年都要找到工作了被谁搞没了
点赞 评论 收藏
分享
点赞 评论 收藏
分享

