牛客341032222号

2025-03-25 00:01 已编辑南昌大学自然语言处理发布于重庆

关注

蚂蚁-NLP算法面经

部门：AI Force
10.21 一面
1、讲项目
2、检索器怎么训练的？
3、召回不准有什么方法提升召回率？
4、reranker有什么方法？
5、检索器和reranker的得分太相近，不可靠如何解决？
6、怎么解决模型输出有害的问题？
7、如何设计损失函数让两个分布尽可能的远？
8、决策树有哪些？
9、简单说一下GBDT的算法原理
10、HMM大概是怎么样的
11、口述编辑距离算法
============================
10.24 二面
1、项目
2、你的CoT是一步的推理吗？
3、ToT如何选取推理路径？
4、如果query和document字面上很相似，但实际上不一样，应该怎么避免召回？
5、我看你的项目基本都是pipeline的搭建，你有什么微调经验吗？
6、你怎么确定数据配比呢？
7、上采样和下采样是什么？
8、蒙特卡洛树搜索（MCTS）了解过吗？
9、微调出现灾难性遗忘怎么办？
10、rnn和Transformer的区别
11、你觉得mamba有可能取代Transformer吗
12、你会java和c++吗？
13、传统机器学习学过吗？
14、天池的比赛参加过吗？
===============================
10.28 hr面
===============================
10.30 三面
主要问实习
===============================
1月份发意向谈薪，已拒
=================
首页第一条帖子招大模型应用算法实习生，欢迎投递

全部评论

推荐最新楼层

牛客143297052号

上海船厂技工学校 Java

二面没做题吗

点赞回复分享

发布于 2025-02-19 15:10 上海

03-25 09:53

广西大学算法工程师

大模型常考面试题100道(第26-50道)

这份题库不是随便凑出来的 100 道题，而是从大量面经和题目里 筛出来的高频题。我整理了上百套校招、实习、校招的大模型相关面试题，又结合公开平台上反复出现的问题，把那些 出现次数最多、覆盖岗位最广、面试最容易问到 的内容统一收拢，最后形成这套 大模型常考面试题100道26. AI Agent 的核心组成有哪些？答：一个完整的 Agent 一般至少有这几部分：大模型本身、任务规划、工具调用、记忆模块、执行控制和结果整理。大模型负责理解和推理，规划模块负责决定下一步做什么，工具模块负责和外部系统交互，记忆模块负责保留用户偏好和任务状态，执行控制负责重试、终止和异常处理。真正上线的 Agent 往往...

AI-Agent面试实战...

点赞评论收藏

分享

03-23 16:40

合肥工业大学算法工程师

字节tiktok大模型算法实习一面

发点面经攒攒人品～1. 数据是怎么合成的，相对于现在主流数据合成有何优化；合成数据的标签是怎么打的，有什么优化的地方2. 数据混合有哪些方法，多样性有哪些角度，怎么保证多样性的同时去除重复数据，讲一下了解的聚类去重，多样性怎么提升3. 怎么清理高质量sft数据，有哪些纬度4. 预训练数据下采样，怎么保证多样性5. 小语种数据怎么合成，方法不限但要控制成本6. 为什么lora相对全参占用显存更少code：高精度开n次根号

查看7道真题和解析

点赞评论收藏

分享

03-24 21:30

门头沟学院推荐算法

滴滴大模型算法实习一面 1h

给我面没招了，发点面经攒攒人品～多Agent系统与垂域大模型落地1. 中心化调度的多Agent架构中，子Agent的接口设计与结果回流机制如何保证系统稳定性？2. 纯Prompt实现的Agent范式下，如何设计评测体系以实现自动化的能力判定与迭代闭环？3. 基于外部知识检索的内容生成，为何容易出现信息复述而非独立推理？如何从算法层面解决这一问题？4. 垂域量化指标（风险/情绪类）的建模中，小样本场景下为何选择LoRA微调而非全量微调或Prompt Engineering？5. 垂域LoRA适配时，如何构造高质量监督数据以保证模型输出数值的合理性与一致性？6. 从原型验证到工程化迭代，如何平衡系统效果、推理成本与训练开销？Transformer Encoder 底层原理与训练稳定性1. 完整描述Transformer Encoder的计算流、残差连接与归一化位置设计。2. 写出多头自注意力的完整数学公式，并说明各维度的含义与变化。3. 从概率分布与梯度视角，解释scaled dot-product中除以√dₖ的必要性。4. 对比固定缩放系数与可学习缩放系数在注意力计算中的训练稳定性与表达效率差异。5. 从序列特性、padding影响、梯度传播三个角度，分析NLP中LayerNorm优于BatchNorm的原因。

查看11道真题和解析

点赞评论收藏

分享

03-24 12:11

门头沟学院推荐算法

腾讯混元大模型算法一面（好难啊

发点面经攒攒人品～1.项目拷打2.实习拷打3.你提到用了CKA你能解释一下它是怎么计算的吗？这个指标真的能评估对齐程度吗4.ModalityAdapter模态适配器这个模块你是怎么设计的？它是怎么起作用的？有没有做过ablation实验？5.对比学习里你怎么构造正负样本的？正负样本不容易区分的时候你们是怎么处理的？有没有用HNM6.你们项目里用了多个loss比如MSE + Contrastive Loss + KL 散度为什么这么设计？有没有出现loss拉扯现象7医疗组手那个项目你说做了Prompt模板设计，能不能举几个例子？分类模板和生成式模板在你们场景下分别怎么做的8你们用的知识库是静态的吗？有没有做向量索引？用的什么方案9怎么避免模型产生医疗幻觉？你们有没有做 hallucination 率评估11.你用过哪些模型推理框架？你觉得Ollama和vLLM区别在哪儿？在车端你们选它们的依据是什么？12.你们说做了14B的车端模型，你们是怎么用SFT数据去做微调的？数据怎么构建的13.评测体系你是怎么搭建的？评测指标都有哪些14.你说你们构建了车载Agent平台Agent链路是怎么调度的多轮对话怎么做状态维护？15.Rewrite模型是你做的，具体输入输出是什么？你们是把 rewrite放在检索前还是后？训练数据是人工构造的吗？16你现在要设计一个多模态模型用于车内驾驶员状态识别，传感器包括摄像头和力传感器，你会怎么设计这个 pipeline

点赞评论收藏

分享

03-23 17:30

门头沟学院推荐算法

百度大模型多模态算法实习面经分享

被横向挂了，希望发出来对大家有帮助！1. 讲一下主要的多模态模型的模型结构2. 对多模态的数据有什么了解，我回答之前看了一些多模态cot的工作构造的dpo数据，以及毕设做的多模态数据增强3. 之前的工作的多模态数据有什么特点和创新点，觉得还可以有什么改进4.统一生成理解模型下游微调各个任务的数据是怎么构造的5. dpo算法是怎么实现的，和其他强化学习有什么区别6. 看项目有目标检测任务，问了IoU是怎么算的，目标检测一般有哪些损失优化code：1. 实现dpo损失，按照想法能写多少是多少，不要求跑通2. 手写IoU损失，要求跑通

点赞评论收藏

分享

评论

7

29

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 面试被问到不会的问题，你怎么应对？ #

18139次浏览 411人参与

# 设计人的面试记录 #

204782次浏览 1629人参与

# 厦门银行科技岗值不值得投 #

15007次浏览 352人参与

# 你见过哪些招聘隐形歧视？ #

18821次浏览 160人参与

# 影石Insta360求职进展汇总 #

183766次浏览 1376人参与

# 你觉得大几开始实习最合适？ #

21308次浏览 220人参与

# 招商银行数字金融训练营 #

105775次浏览 915人参与

# uu们，春招你还来吗？ #

57732次浏览 538人参与

# 你都用vibe coding做过什么？ #

15787次浏览 639人参与

# 面试中，你被问过哪些奇葩问题？ #

93887次浏览 1086人参与

# 虹软科技求职进展汇总 #

16581次浏览 138人参与

# 供应链/物流校招攻略 #

12312次浏览 218人参与

# AI Coding实战技巧 #

10403次浏览 240人参与

# 恒生电子笔试 #

19579次浏览 154人参与

# 做完笔试后你收到面试了吗？ #

21149次浏览 204人参与

# 你现在一天AI几次？ #

8534次浏览 109人参与

# 学历VS实习，哪个更重要？ #

352次浏览 18人参与

# 面试吐槽bot #

186453次浏览 911人参与

# Vibe Coding 会干掉初级岗位吗？ #

16614次浏览 200人参与

# 大厂实习和小厂实习最大的区别是什么？ #

34584次浏览 244人参与

# 如果人生可以debug你会改哪一行? #

7882次浏览 126人参与

# Claude Code泄露源码 #

12067次浏览 156人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务