CUDA面经

实习和秋招都面了一些高性能计算的岗,分享一点被问过的cuda八股
SIMT是什么
occupancy和什么有关,怎么控制
bank conflict粒度
GEMM分块大小受什么影响
float4读写gmem为什么更快
block能否被调度到不同sm上
常用卡的cache是多大
divergency对性能的影响
nvidia gpu的指令级并行
手撕矩阵转置
手撕向量外积
全部评论
大佬,这个赛道很卷吗?
3 回复 分享
发布于 2023-09-21 15:00 上海
市面上会cuda的应该很少吧,感觉lz挺好找工作的?
2 回复 分享
发布于 2023-09-08 14:13 上海
感谢楼主分享,所以float4为什么会更快呀,这点一直挺困惑的
2 回复 分享
发布于 2023-09-04 12:59 上海
大佬点技能树的时候,会学tvm推理引擎,训练框架这些吗
1 回复 分享
发布于 2023-09-17 10:06 山西
楼主拿到哪家的offer了吗
1 回复 分享
发布于 2023-09-04 14:03 广东
佬最后去哪了?
点赞 回复 分享
发布于 04-23 17:24 安徽
mark
点赞 回复 分享
发布于 2024-05-13 15:05 上海
m
点赞 回复 分享
发布于 2023-09-06 21:37 江苏
请问下大佬,面高性能计算岗,cuda的话怎样的项目算是比较有含金量
点赞 回复 分享
发布于 2023-09-06 00:15 广东

相关推荐

11-18 18:16
企业号
CIKM是全球信息检索与知识管理领域的权威学术会议之一。今年,第十届“信也科技杯”全球AI算法大赛入选CIKM 2025官方赛事单元,并成为IJCAI 2025官方合作单位。信也科技首席运营官及首席技术官、中国区总经理王玉翔受邀在线上发表致辞。他表示:“在信也科技杯十周年之际,我们非常荣幸能够携手 CIKM 2025,让公司持续投入的产学研平台得到进一步升级。我们希望与全球研究者共同推动可信 AI 的边界拓展,以开放合作的姿态守护数字世界的安全与信任。”第十届“信也科技杯”全球AI算法大赛聚焦视觉深度鉴伪识别,吸引了来自全球的 426 支队伍、652 名参赛者。在 CIKM 2025 工作坊上,信也科技副总裁陈磊分享了深伪识别的最新挑战。他表示:“低成本生成式 AI 工具的涌现、生成质量的快速提升,以及‘攻防不对称’导致的反欺诈技术滞后,都在让深伪问题变得更加复杂。”目前,信也科技已建立起多层防御体系,包括深伪检测模型、多模态生物识别验证以及自适应反欺诈算法,不断提高识别虚假信息的能力。首席科学家王春平回顾了“信也科技杯”十年的发展历程。从数据应用到算法前沿,从国内走向全球,科技杯始终坚持“有学术挑战、有真实场景、有业务价值”的原则,持续推动产业问题与前沿研究的连接。信也科技算法专家倪博溢等从数据沉淀与行业挑战切入,系统呈现了 AI 鉴别的发展趋势,并介绍了集团的最新技术成果。在工作坊现场,多位优胜参赛选手展示了针对深伪人脸识别的创新思路,包括利用更灵活的视觉主干网络、轻量化的数据增强策略、更高效的推理流程以提升实际应用效果。这些成果展现了产业真实问题激发的研究潜力,也为未来的反深伪技术提供了新的方向。点击查看详情:https://mp.weixin.qq.com/s/IvjEIWOuB5VXM5DhsI-8Sg?mpshare=1&scene=1&srcid=1118TI5sF4lIMyh4kfxc3o1U&sharer_shareinfo=4019b4e771a762b1f98e0123e1ee2d19&sharer_shareinfo_first=4019b4e771a762b1f98e0123e1ee2d19&color_scheme=light#rd
点赞 评论 收藏
分享
评论
20
221
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务