百度社招凉经
大模型推理方向
一面
八股:page attention,flash attention,moe,gptq,awq,pd分离架构,cuda的内存模型和线程模型。vllm-v0和vllm-v1的区别。
项目:简历上的
手撕:一道全排列的题目
二面
八股:MLA,GQA,flashattention的三个版本区别
开放式问题:
给你几个服务器和几张计算卡,你怎么做PD切分
手撕:一道动态规划的题
三面:待定
问了HR说在等反馈,然后目前还没有消息,感觉凉凉。
一面
八股:page attention,flash attention,moe,gptq,awq,pd分离架构,cuda的内存模型和线程模型。vllm-v0和vllm-v1的区别。
项目:简历上的
手撕:一道全排列的题目
二面
八股:MLA,GQA,flashattention的三个版本区别
开放式问题:
给你几个服务器和几张计算卡,你怎么做PD切分
手撕:一道动态规划的题
三面:待定
问了HR说在等反馈,然后目前还没有消息,感觉凉凉。
全部评论
上午收到消息,二面挂了
相关推荐
07-30 11:49
门头沟学院 Java 点赞 评论 收藏
分享