推理部署优化/高性能开发 春招总结-1
腾讯
一面
1. Tensorrt-LLM, AGI , VLLM源代码区别
2. 为什么要有continue batch
3. fastllm.cpp 的源代码
4. yolo加速
5. Python 计算密集型使用多进程还是多线程
6. C++继承怎么实现的
7. 最大子数组之和
二面
1. 求比特位中1个个数
2. 编译时运行
3. VLLM ,PageAttention
4. Cuda 内存模型介绍
5. 使用triton 实现 PageAttention
二面挂
#金三银四,你有感觉到吗#
#春招提前批,你开始投了吗#
一面
1. Tensorrt-LLM, AGI , VLLM源代码区别
2. 为什么要有continue batch
3. fastllm.cpp 的源代码
4. yolo加速
5. Python 计算密集型使用多进程还是多线程
6. C++继承怎么实现的
7. 最大子数组之和
二面
1. 求比特位中1个个数
2. 编译时运行
3. VLLM ,PageAttention
4. Cuda 内存模型介绍
5. 使用triton 实现 PageAttention
二面挂
#春招提前批,你开始投了吗#
全部评论
佬,面的啥部门呀
大佬自学吗还是课题组方向
请问应该投什么岗位呢这个方向
面得这么恐怖吗
mark
大佬,这个岗位投递名字是啥啊
mark
mark
mark
佬,triton实现pagedattention是手撕吗
相关推荐
04-08 12:19
天津工业大学 产品经理 点赞 评论 收藏
分享
05-05 12:57
门头沟学院 前端工程师 记着呢:说的很对,已经工作近7年,就是觉得年轻的时候太多忧虑,没有好好玩一玩,虽然现在我也是很多忧心事,但是真的感觉年轻的时光才是最宝贵的,玩的开心,做自己喜欢的事,全力以赴,这才是应该做的
点赞 评论 收藏
分享
查看14道真题和解析