网络冲浪十级选手兼潜水冠军

03-03 13:35 门头沟学院机器学习

关注

AI Infra面经攒人品版

继续来分享下之前的面经~欢迎友好讨论，信息共享
1️⃣算法题：手撕内存池（要求支持类似new Foo[], delete []功能)，c++如何比较两个float是否相等，LRU，岛屿个数，二叉树的层序遍历，hamming weight，k-coverage intervals

2️⃣torch手撕题: LoRA adapter

3️⃣cuda手撕题：
1- 支持torch broadcast的4D tensor的elementwise mul
2- A: (1, 256), B: (256, 128), C: (128, 256) ，计算 (A * B) * C
3- Embedding Sparse Feature Pooling：A是 100 万个离散 ID（0~999），B是 100 万个float，计算个长度为1000的float数组C，C[i] = \sum_{j s.t. A[j] = i} B[j]

4️⃣ai infra或算法八股：
1- llm的知识蒸馏放在预训练做是否合适
2- Hopper TMA的优点，调用方式，是否需要经过L1
3- Flash Attention v2为什么外层对Q循环，Flash Decoding的combine kernel耗时占比大概是多少
4- Mooncake kv-cache centric的PD分离
5- Dit的推理框架设计思路和LLM的有什么异同
6- 分析MLA decode的计算访存比，它和seqlen、batch size是否相关
7- diffusion model的训练和推理步骤，推理num_inference_steps为40时，为什么训练的timesteps仍要设成1000
8- 介绍dLLM，如何看待它和AR的区别
9- torch.repeat 和 torch.expand的区别
10- torchrun的启动参数有哪些，如何在Linux上批量kill包含torchrun的进程

全部评论

推荐最新楼层

昨天 15:22

长沙理工大学 C++

985跨考北大软微AI，AI 领域知识体系该怎么搭建？大模型实习该怎么投？

网友提问：目前研0，刚刚拟录取，本科就读于某985计算机无关专业，二战跨考上岸北大软微人工智能专业。对传统深度学习有一定了解，学过pytorch，能手撕transformer，代码能力较强，力扣hard以下基本可以轻松手撕。目前有两个困惑，1.对ai领域有一定了解，但是又缺乏一个系统性的知识框架，对接下来的学习比较困惑。2.想投大模型相关实习，推荐向哪类公司投递实习？如果不好投的话，我个人应该在哪些方向上继续努力？Yt回复：一、这个背景，有大厂机会吗？首先明确告诉你：有大厂机会，而且机会很多。本科985（虽说与计算机无关），二战上岸北大软微——这个背景，市面上基本上所有的知名企业，应该都会给你...

点赞评论收藏

分享

04-14 22:38

东北大学 C++

快手ai infra二面

问简历 cutlass2.0 怎么实现grouped gemmfa3和fa4区别blackwell和hopper比有什么变化hang都有可能因为什么，分别要如何排查CUDA_DEVICE_MAX_CONNECTIONS能干什么，和launch bound什么关系寄

查看5道真题和解析

点赞评论收藏

分享

04-22 17:08

广西大学算法工程师

AI Agent常考面试题汇总- LoRA篇

1. 什么是 LoRA？LoRA 全称是 Low-Rank Adaptation，核心思想是在微调大模型时不直接更新原始大权重矩阵，而是冻结预训练权重，只额外学习两个低秩矩阵，用这两个小矩阵的乘积去近似原权重的增量。原来如果某层权重是： W ∈ R^(d×k) LoRA 不直接学习 ΔW 的完整矩阵，而是写成： ΔW = B A A ∈ R^(r×k), B ∈ R^(d×r), 且 r << min(d, k) 最终前向变成： h = W x + ΔW x = W x + B A x 这样训练参数量会大幅下降。2. LoRA 的思路是什么？LoRA 的基本假设是：大模型在迁移到下...

AI-Agent面试实战...

点赞评论收藏

分享

昨天 19:16

已编辑

门头沟学院 Java

京东零售AI infra训练团队研究型实习生招聘

base北京，团队直招流程迅速。硬件资源充足，技术氛围浓厚，业务场景丰富，有竞争力的薪资+免费公寓+餐补（优秀候选人可额外推荐为TGT实习生），鼓励实习生发paper。主要参与LLM/CTR模型的训练性能优化，包括但不限于稀疏embedding模型优化，多智能体RL/RL训练性能优化，多模态大模型训练性能优化，算子性能优化，分布式通信优化，流水线并行优化等。欢迎有意向的同学沟通，********************满足以下条件的候选人优先考虑：1、可实习6个月以上；2、工程能力优秀，在知名开源项目有贡献；3、有系统/AI顶级会议论文发表经验（如SIGCOMM、NSDI、SC、ASPLOS、ICLR、ICML等）；官方JD如下：【岗位职责】1、参与LLM/多模态/生成式推荐模型训练引擎的设计、开发和优化，解决训练过程中的技术和性能问题；2、针对大规模异构分布式算力和计算进行优化，提高计算效率和可扩展性；3、深入京东零售核心算法业务，分析业务功能和性能痛点，设计合理的技术优化方案并确保实际落地；4、参与制定核心业务项目计划和需求分析，确保项目按时交付和达到高质量标准；【岗位要求】1、具备扎实的数据结构与算法功底，熟练掌握Python/C++编程技巧，具有良好的编程习惯以及工程与沟通能力；2、熟悉至少一种主流深度学习编程框架（Tensorflow/Pytorch）和分布式计算引擎（Megatron/Deepspeed），熟悉其底层架构和实现机制，有分布式系统开发和调优经验优先；3、掌握深度学习基础知识，了解常用的深度学习模型和算法，了解LLM基础理论和方法；4、熟悉CUDA编程模型和GPU加速技术等，有基于国产化芯片（如华为晟腾、寒武纪等）的深度学习框架开发和优化经验优先；5、熟悉业界主流的模型优化和调优方法，有对深度学习模型进行性能优化和效率提升的经验；6、实习期3个月以上；

点赞评论收藏

分享

04-18 12:48

香港中文大学（深圳）人工智能

【暑期实习】华为 AI 工程师一面复盘

项目深挖很多，最后还有一道“手写”代码题这场华为 AI 工程师暑期实习的面试，整体节奏比较完整，基本就是“自我介绍—项目深挖—反问—代码题”这一套。刚开始先让我共享桌面，结合简历做自我介绍，讲自己的学习背景、做过的项目，以及现在的方向。前面这部分我还是按自己的主线来讲：山大本科电子和计算机双修，港中深硕士，方向慢慢转到 AI Infra、异构计算和性能优化；实习这边讲了之前做过的通用软件工程工作，以及现在做的算子优化和图优化相关内容。面试官前面没有特别打断，但后面几乎每一段都会继续往下追。项目里问得最多的，一个是我自己做的量化推理 runtime，另一个是现在在做的算子/图优化相关工作。量化项...

查看18道真题和解析

点赞评论收藏

分享

评论

1

11

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 如果春招能重来，我会___ #

2355次浏览 20人参与

# 你觉得最好用的AI编程工具是_ #

416次浏览 16人参与

# 联宝杯大学生创新大赛，你的技术值得产业级答案 #

26675次浏览 468人参与

# 除了线上，还能去哪些地方投简历 #

1030次浏览 17人参与

# 面试官拷打AI项目都会问什么？ #

742次浏览 22人参与

# 你和你的mentor相处模式是__ #

4287次浏览 31人参与

# mt对你说过最有启发的一句话 #

114808次浏览 866人参与

# 你的mentor是什么样的人？ #

61359次浏览 793人参与

# 你会因为行情，降低找工作标准吗？ #

3203次浏览 25人参与

# 实习第一天，你在干什么 #

2744次浏览 18人参与

# 双非本科的出路是什么？ #

230511次浏览 1655人参与

# 如何排解工作中的焦虑 #

320183次浏览 2737人参与

# 你有哪些缓解焦虑的方法？ #

60692次浏览 914人参与

# 宣讲会你有哪些意向不到的收获 #

25111次浏览 80人参与

# 你收到了团子的OC了吗 #

1603283次浏览 11858人参与

# 一觉醒来，秋招难度下降一万倍…… #

147670次浏览 786人参与

# 哪些公司在招寒假实习？ #

95256次浏览 767人参与

# 0offer互助地 #

774256次浏览 4763人参与

# 你是怎么和mt相处的？ #

103185次浏览 509人参与

# 你想吐槽公司的哪些规定 #

49027次浏览 245人参与

# 打工人的工作餐日常 #

97183次浏览 559人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务