百度社招凉经

大模型推理方向

一面
八股:page attention,flash attention,moe,gptq,awq,pd分离架构,cuda的内存模型和线程模型。vllm-v0和vllm-v1的区别。

项目:简历上的

手撕:一道全排列的题目

二面
八股:MLA,GQA,flashattention的三个版本区别

开放式问题:
给你几个服务器和几张计算卡,你怎么做PD切分

手撕:一道动态规划的题

三面:待定
问了HR说在等反馈,然后目前还没有消息,感觉凉凉。
全部评论
上午收到消息,二面挂了
点赞 回复 分享
发布于 08-04 11:07 安徽

相关推荐

评论
点赞
3
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务