晋级面霸 level
获赞
103
粉丝
45
关注
0
看过 TA
609
山东大学
2026
算法工程师
IP属地:山东
暂未填写个人简介
私信
关注
算法题: 1- 快排,寻找两个正序数组的中位数,下一个排列,二叉树中的最大路径和,Path Sum III2- 给定若干点的数轴坐标数组和固定数量的等长线段,问该线段最少要多长才能覆盖所有点3- 前k个高频字符串,词频一样时按字典序升序排列4- 给定初始字符串s,每次将字符串向右旋转一次,并将旋转后的字符串拼接到原字符串的末尾,每次操作都会使字符串的长度变为原来的两倍,求计算出无限扩展后的字符串中第 N个位置的字符5- 两根手指放在26个小写字母组成的键盘上,最少移动多少距离才能敲出给定的字符串sorch手撕题:MHA * 3,Flash Attention v1,flow matching model采样的伪代码ai infra或算法八股:1- flow matching模型预测的是什么,怎么理解conditional velocity (conditioned on data sample x0)2- 如何计算QwenImage的time shift3- 介绍Flash Attention的原理和实现思路4- GPU matrix transpose使用shared memory的好处5- CPU按列遍历一个行优先的矩阵相比按行遍历为什么性能会变差,具体是因为哪个性能指标变差导致的6- weight-only量化有哪些,实现weight-only量化cuda kernel时如何优化访存,是否了解Marlin kernel7- Megatron SP的实现方式8- DeepSpeed ZeRO stage1和stage 2的通信量区别,论文和代码实现有没有gap9- 多GPU通信时NVSHMEM和NVLink的区别
查看15道真题和解析
0 点赞 评论 收藏
分享
发一下问题给大家参考,攒攒人品!!!1.项目是基于自己的兴趣,还是follow现成项目2.这个项目是主要是为了解决什么问题3.训练是基于 torch 写的,还是用现有的框架4.保存加载checkpoint怎么实现的5.项目怎么做到能跑起来?遇到什么困难?怎么解决?6.Qwen tokenizer 中并没有图像相关的 token,那么在构建多模态输入时,应该如何在文本序列中表示图像位置8.占位 token 在经过 tokenizer 和embedding 后,模型是否能够稳定地识别它的存在?它在 embedding 空间中是否具有明确的语义位置,还是只是一个噪声 token9.你用什么指标测模型10.Deepspeed11.zero12312.Zero3 是模型并行吗13.8 卡环境下使用 ZeRO-3 训练时,数据并行度是多少14.Megatron15.8 卡环境下使用Megatron训练时,数据并行度是多少16.训过PPO吗17.PPO 的reward model是怎么训的18.PPO 再往底层学了吗?讲一下蒙特卡洛和 TD error 的区别19.为什么他们是两个极端20.PPO 加载了哪几个模型?哪些模型是freeze,哪些是激活的?以及它每个模型做了什么21.你的PPO 的 critic model 是怎么初始化的22.LLM场景下,传统强化学习中的核心概念(Actor、Environment、State、Action、Reward、Value)分别对应什么23.R和V的关系?Value 函数在估计什么量24.DPO和PPO的关系25.DPO加载几个模型26.DPO的推导27.重要性采样两个pi的比值落实到代码层面是什么计算的28.LLaVA-one-vision、LLaVA-NeXT29.llava怎么实现动态分辨率的30.qwenvl系列是如何实现动态分辨率的31.了解qwenvl系列吗32.qwenvl在旋转位置编码上的改进33.场景题:在视频多模态模型(如 Qwen-3B / Qwen-Omni)中,模型存在 video grounding 不准确和“幻觉定位”的问题。如何系统性地设计数据、训练策略、评估与约束机制,来有效提升模型的事件定位准确性34.根号dk的作用35.手撕self-attention
0 点赞 评论 收藏
分享

创作者周榜

更多
关注他的用户也关注了:
牛客网
牛客网在线编程
牛客网题解
牛客企业服务