华为面试 冬寒赐浴华清池

🕒 岗位/笔试时间
10.31 两轮连续面,面完直接给过等主管面
👥 面试题目
一面
自我介绍 项目提问 用过的cv模型 多模态大模型了解情况 笔试题目复盘 编程leetcode原题动态规划
二面
深挖贡献最多的项目 一点点讲明白 编程题 字符串处理

🤔 面试感受
不知道为什么,感觉二面好奇怪,追着算法的具体实现问,把每个部分都讲清楚,最后编程题应该也是easy难度的。这种过了是不是也是泡池子啊
😭😭😭😭
———————————————————
11.21主管面
不知道为什么过了20天才进行主管面,心急
浅浅地问了一些项目 工作上的问题处理等等
问了base意向
面试官人很好很和蔼
1145很准
25迟了一点点 但好歹是给机会泡了
爱华信华等华
全部评论
二面怎么理解,是会问哪些算法呢,真心求教
点赞 回复 分享
发布于 2024-11-04 20:37 上海
校友是线上面试吗,蹲一个面试结果
点赞 回复 分享
发布于 2024-11-04 15:03 天津
tju 校友好
点赞 回复 分享
发布于 2024-11-04 08:07 香港

相关推荐

发点面经攒攒人品1、你在线上或离线训练时,过拟合怎么处理?直接说你最有效的三个方法和拿到的收益。2、把 BN 讲透:原理是什么;训练期和推理期用的统计量有何不同;跟 LN、GN 比,分别什么时候用、怎么取舍。3、分类和回归你最常用哪些损失?你更偏好哪几个,为什么(从鲁棒性、梯度、数值稳定性上谈)。4、L1 和 L2 正则你怎么选?它们各自的效果与风险是什么,工程里你是怎么权衡的。5、二元和多分类的交叉熵你怎么写?在工程里你怎么做数值稳定实现。6、AUC 到底在统计上代表什么?你怎么计算它,在线上业务里你如何解释“这次 AUC 提升”的含义。7、你做 CTR/CVR/CTCVR 联合建模时,ESMM/ESMM2 是怎么推导与工程落地的?线上到底带来了什么收益。8、Transformer 里因果注意力的 Q/K/V 各从哪来?Mask 具体怎么实现。9、Scaled Dot‑Product Attention 为啥要除以 √dk?如果不除会出什么数值或训练问题。10、把 Transformer / Decoder‑only 的整体结构过一遍,各个组件分别在干什么,有哪些常见变体。11、位置编码这条线你怎么选:绝对 PE、相对 PE、RoPE 各自的思路、优势和局限,结合你的项目谈取舍。12、长上下文怎么搞?Rope scaling、Position Interpolation、KV Cache 管理、检索增强、窗口注意力,你的实战方案是什么。13、KV Cache 在训练和推理中的差异是什么?它的加速价值有多大,吞吐与延迟你是如何权衡的,vLLM/paged‑attention 需要注意什么。14、PEFT 方案里(LoRA/QLoRA/Prefix/Prompt‑Tuning/Adapter)你怎么选?说说稳定训练的经验。15、SFT 和对齐(RLHF/DPO/IPO/PPO)原理差在哪?在不同数据与资源条件下,你怎么选路线。16、RAG 系统你怎么设计?切分、索引、召回/重排、压缩/融合、兜底策略怎么串。17、提示词工程你是怎么搞的?System/角色/约束/分步指令怎么写,如何防越狱
查看17道真题和解析
点赞 评论 收藏
分享
算法题: 1- 快排,寻找两个正序数组的中位数,下一个排列,二叉树中的最大路径和,Path Sum III2- 给定若干点的数轴坐标数组和固定数量的等长线段,问该线段最少要多长才能覆盖所有点3- 前k个高频字符串,词频一样时按字典序升序排列4- 给定初始字符串s,每次将字符串向右旋转一次,并将旋转后的字符串拼接到原字符串的末尾,每次操作都会使字符串的长度变为原来的两倍,求计算出无限扩展后的字符串中第 N个位置的字符5- 两根手指放在26个小写字母组成的键盘上,最少移动多少距离才能敲出给定的字符串sorch手撕题:MHA * 3,Flash Attention v1,flow matching model采样的伪代码ai infra或算法八股:1- flow matching模型预测的是什么,怎么理解conditional velocity (conditioned on data sample x0)2- 如何计算QwenImage的time shift3- 介绍Flash Attention的原理和实现思路4- GPU matrix transpose使用shared memory的好处5- CPU按列遍历一个行优先的矩阵相比按行遍历为什么性能会变差,具体是因为哪个性能指标变差导致的6- weight-only量化有哪些,实现weight-only量化cuda kernel时如何优化访存,是否了解Marlin kernel7- Megatron SP的实现方式8- DeepSpeed ZeRO stage1和stage 2的通信量区别,论文和代码实现有没有gap9- 多GPU通信时NVSHMEM和NVLink的区别
查看15道真题和解析
点赞 评论 收藏
分享
评论
点赞
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务