北京智源研究院-AI编译器工具链-二面

二面
1. 自我介绍
2. 推理框架的设计,计算图,运行图,内存管理
3. 动态图,静态图,动态shape
4. 图优化
5. warp之间通信
6. cuda reduce
7. cuda softmax,warp处理与block处理的区别
8. block,grid的设置,调度,为什么会影响算子速度
9. CUDA的计算模型
10.flash attention v1 v2

面试时间:45分钟
#面经#
#高性能计算#
#高性能计算面经#
#模型部署#
全部评论
不懂就问。啥是运行图
点赞 回复 分享
发布于 2024-09-21 03:32 湖南
手撕两道cuda?
点赞 回复 分享
发布于 2024-09-14 10:31 广东

相关推荐

06-27 18:53
门头沟学院 Java
这样才知道自己不适合搞代码,考公去咯
只爱喝白开水:我也发现不适合搞代码,打算转非技术方向了
点赞 评论 收藏
分享
门口唉提是地铁杀:之前b站被一个游戏demo深深的吸引了。看up主页发现是个初创公司,而且还在招人,也是一天60。二面的时候要我做一个登录验证和传输文件两个微服务,做完要我推到github仓库,还要我加上jaeger和一堆运维工具做性能测试并且面试的时候投屏演示。我傻乎乎的做完以后人家跟我说一句现在暂时不招人,1分钱没拿到全是白干
点赞 评论 收藏
分享
评论
2
10
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务