蚂蚁转正实习算法一面

共50min

1. 自我介绍
2. KV Cache的进化之路,详细讲
3. 知识蒸馏的理解,出了几个场景问我怎么衡量蒸馏的好坏
4. RAG技术原理,如何衡量RAG回答的好坏?
5. 代码题 比较简单 将node连起来 简单哈希就行
6. 反问 加班不 裁员不 转正率如何

体验还是比较好的,和团子差不多,像聊天一样
全部评论
哪个部门啊佬
点赞 回复 分享
发布于 2025-03-28 13:52 江苏

相关推荐

03-17 18:07
已编辑
东南大学 C++
字节抖音AI搜索,主要以cpp开发1.自我介绍。2.介绍一下你的这些项目吗?多agent项目3.你的主控 Agent 的输入是什么?4.你的子 Agent 是怎么让主控 Agent 感知到的?5.你的 Agent 和 Agent 之间是怎么交互的?有什么协议吗?6.你是怎么决定要开发这几个子 Agent 的?各agent分别承担什么功能?7.你的数据来源是什么?8.你刚刚说的大盘行情数据、新闻这些,又分别是从哪个数据源来的?9.你这个怎么提取关键词的?10.这些新闻或者搜索到的文本数据拿到以后,你会做什么处理?11.你会限制整个 context 的长度吗?12.你这里限制是多少?13.那 token 和文本的换算关系你大概了解吗?一个 token 大概对应多少文本?14.你的模型输入最大允许多大的窗口?15.你为什么会选择调多个模型?其实选一个最适合的模型是不是就够了?16.你有调研过各个模型的特性吗?你是怎么选的?17.千问你这边有用吗?18.你这个简要的 RAG 框架?19.你可以从输入开始,简单说一下你整个 RAG 框架的流程吗?20.那你这个知识库和新闻,这两个 Agent 的定位区别是什么?21.你为什么会采用 multi-agent 的架构,而不是一个 Agent 加一堆工具的架构?22.你的模型推理链路是怎么部署的?八股26.你可以说一下,我们在浏览器里面输入一条链接以后的通信过程吗?27.HTTP 和 HTTPS 有什么区别?28.什么叫线程安全?29.你用过哪些锁?互斥锁用过吗?30.你了解互斥锁大概怎么实现吗?31.还有其他哪些锁?32.写时复制了解吗?33.进程间有哪些通信方式?算法题二叉树最大宽度大半时间都是揪着我的多智能项目来问,业务针对性强。开学第一场,对新做的项目整体准备不太完善,答得不太行,估计面评也脏了,到发布日期字节没第二场了面AI相关岗位可以参考一下它的提问方式。
查看30道真题和解析
点赞 评论 收藏
分享
AI大模型算法,一环扣一环的拷打Transformer 基础详细介绍 Transformer 架构(Encoder-Decoder 结构、位置编码、FFN 等)Decoder 的因果注意力中,Q、K、V 分别来自哪里?→ Q 来自当前 Decoder 输入(已生成的 token 序列),K 和 V 也来自同一序列(需 mask 未来信息)Attention 为什么要 scaled?不做会怎样?为什么是√dₖ?→ 点积随 dₖ增大会让 softmax 进入饱和区,导致梯度消失;除以√dₖ可使方差稳定在 1(数学推导参考 Vaswani 论文)Transformer 如何加速推理?KV Cache 是什么?训练 vs 推理的并行性差异?→ 训练时所有 token 并行计算;推理时自回归,KV Cache 可缓存历史 K/V,避免重复计算,大幅提速多模态论文深挖(以 Video-LLaMA 为例)讲解 Video-LLaMA 的整体结构→ 视频编码器(如 ViT + Temporal Aggregator)→ 投影层(对齐文本空间)→ LLaMA 语言模型论文中 CoT(Chain-of-Thought)的具体设计?→ 在 prompt 中加入推理步骤示例(如 “视频中先看到人挥手,然后狗跑过来…”),引导模型分步作答微调 & 分布式训练微调用了 LoRA,介绍其原理→ 将权重更新 ΔW 分解为低秩矩阵 A×B,冻结原模型,只训练 A、B,大幅减少可训练参数LoRA 初始化怎么做?秩(rank)设为多少?为什么选这个值?→ A ~ N (0, σ²),B 初始化为 0;常用 rank=8 或 16,在效果和参数量间取得平衡(实验验证)知道 DeepSpeed 和 Megatron 吗?分别说说→ DeepSpeed(微软):主打 ZeRO 显存优化;Megatron-LM(NVIDIA):张量并行 + 流水线并行论文用 DeepSpeed,三个 Stage(ZeRO-1/2/3)分别是什么?→ Stage1:优化器状态分片;Stage2:+ 梯度分片;Stage3:+ 模型参数分片(通信换显存)二面下一篇再写吧,力竭了
查看10道真题和解析
点赞 评论 收藏
分享
评论
4
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务