05-06 07:35 门头沟学院算法工程师

关注

快手实习多模态算法一面分享（好难啊

给我面没招了，发点面经攒攒人品～
1.CLIP的结构+一个batch里面混入了相同的图片，也就是说一个正样本被当作一个负样本，但它实际是一个正样本，怎么去解决和避免这些问题?在训练或者说Loss层面
2.CLIP可以做分类吗?通过对齐的方式做分类你觉得是可行的吗?
图像输入给大模型，解码输出文本，这样的对齐方式和CLIP有什么区别?这两种哪种是未来趋势?
3.COT有了解过吗?结构化的输入/few-shot 为什么会有帮助?(模型层面)
4.有了解过哪些大模型?BLIP2的三个loss介绍
5.现在大部分的结构不采用Q-former，而用MLP，是为什么?那为什么之前不用MLP，而用Q-former?
6.一个多模态模型，它的视觉和文本编码器的参数量大小有什么配比的逻辑?
7.一个5乘5的卷积，它可以由几个3乘3的卷积串联来替换，从而减少计算量但保持感受野不变?
8.分类任务需要很多标注样本，但是现在想在少量样本的情况下，实现新增任务的效果，如何实现?不希望通过大量数据做微调

全部评论

推荐最新楼层

门头沟学院人工智能

5x5拆3x3这种数学题面试还问啊

点赞回复分享

发布于 05-07 12:57 广东

摆到三点半

门头沟学院人工智能

qformer退场是面试常考点吗

点赞回复分享

发布于 05-07 11:01 上海

05-10 15:34

中国农业大学算法工程师

拼多多多模态算法一面面经记录攒人品

发面经攒人品

点赞评论收藏

分享

05-11 21:41

中山大学算法工程师

爱奇艺大模型算法岗面经

1️⃣一面 1. Transformer、CLIP原理，图文对齐层工作机制2. CLIP衍生进阶模型；检索场景模型适配改造思路3. Transformer各类Decoder结构4. 大模型通用预训练流程；电商垂域预训练必要性及原因5. GRPO公式推导；PPO四大组成模型手撕：多头注意力MHA代码2️⃣二面1. LoRA落地场景、常用超参配置2. 长文本模型结构优化；Qwen3-VL RoPE、MRoPE原理，其他位置编码方案3. 长文本训练各类优化Trick4. 多模态图像Token冗余过多解决方案；图像Token长度限制实现方式5. BF16与FP32精度差异、训练选型；训练推理精度一致性问题手撕：反转链表3️⃣三面1. 多模态Embedding设计经验、图文对齐方案与主流对齐方式2. Embedding模型与Reranker差异，二者训练Loss区别📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

查看14道真题和解析

点赞评论收藏

分享

05-22 21:35

广西大学算法工程师

阿里云 AI 应用开发暑期一二面

5.16 三面结束 我看粉丝投稿的4.21 一面的 二面过完5.11. 自我介绍2. 怎么理解深度学习损失函数中的最大似然估计 MLE？答案：最大似然估计的目标是找到一组模型参数，让观测到的数据在当前模型下出现的概率最大。深度学习里的分类任务通常把模型输出看成条件概率分布 p(y|x; θ)，训练时希望真实类别的概率越大越好。实际优化时通常不会直接最大化似然，而是最大化对数似然，或者等价地最小化负对数似然。交叉熵损失本质上就是负对数似然。比如多分类中，真实标签是第 y 类，模型对这一类预测概率是 p_y，loss 就是 -log(p_y)。预测越自信且正确，loss 越小；预测越错，loss ...

AI-Agent面试实战...

点赞评论收藏

分享

05-11 15:24

已编辑

门头沟学院数据仓库

浙江小厂AI工程师面经

做政务系统的小厂1.自我介绍2.介绍一下你的智能体项目3.一个智能体分成几个部分，他的结构是什么4.你在这个项目中知识库文档是怎么做切分的，文档大小大概是多少5.你在项目中怎么设计AI思维链的6.你用的什么框架，langchain开发的7.langchain框架8.问一个sql问题，leftjoin和innerjoin有什么区别9.在你的项目中，rag是怎么做的，用到那些方法10.检索方法是什么，只用到向量检索吗，还是也用到了其他检索方法11.对上下文是怎么处理的12.怎么用Python进行爬取，会哪些反爬13.你在做文档切分的过程中，是怎么处理段落问题和长文本的因为是线下面试，问了好多，记不住了，面了一个小时，强度好高

查看13道真题和解析

点赞评论收藏

分享

05-05 20:32

中山大学算法工程师

淘天AI Agent 一面面经

1. 挑选个人复杂度最高、难点最突出的项目完整讲解，重点说明项目核心痛点、落地难点、技术瓶颈与最终落地解决方案。2. 结合项目场景，说明Agent任务目标拆解逻辑，以及PPO算法完整训练指标、效果评估标准。3. 阐述RLHF对齐偏好定义逻辑，大模型对话优劣好坏的标注标准与偏好数据集构建逻辑。4. 详细讲解奖励模型RM、Critic网络结构设计思路，组件有效性验证方式、调优优化策略，以及整体对话效果量化评估方案。5. 对比选型SFT、DPO、PPO、GRPO、RAG多条技术路线，说明为何选用强化学习做Agent对齐优化，完整输出各方案评估维度、适配场景与选型依据。6. DPO全流程效果评估方式，结合实际业务案例说明DPO固有短板，对比DPO与GRPO原理差异、优劣特点与落地适用场景。7. 从算法原理角度，讲解GRPO具备更强探索能力、稳定训练的核心原因。8. 阐述个人参与RAG相关项目初衷，梳理RAG系统整体架构与核心工作内容。9. 对比语义切分、固定长度切分、递归语义切分优劣，说明递归切分选型原因，以及不规则、非结构化文档专属预处理方案。10. 梳理向量数据库选型核心考量维度，结合线上高并发、低延迟生产环境，说明落地选型策略。11. 说明关键词检索+向量检索混合检索设计原因，介绍召回率、准确率等检索效果客观量化评价指标。12. 针对检索召回不足、匹配精度偏低、上下文关联性差等问题，逐条梳理全链路优化手段。13. 讲解用户意图模糊、指代不清、需求不明确类问题的意图识别与澄清处理方案。14. 讲解重排序模型选型、技术实现、解决的检索冗余错乱问题，所用开源/商用工具库，以及不同重排模型横向对比实验结论。📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

查看14道真题和解析

点赞评论收藏

分享

评论

1

1

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 实习生的蛐蛐区 #

998104次浏览 5078人参与

# 国企是春招机械人最好的去处吗 #

153829次浏览 585人参与

# 发面经攒人品 #

8867623次浏览 98409人参与

# 硬件人的简历怎么写 #

350822次浏览 3147人参与

# 27届实习投递记录 #

163093次浏览 1658人参与

# AI了，我在打一种很新的工 #

208296次浏览 2218人参与

# 万物皆可发面经 #

4300次浏览 57人参与

# 实习，不懂就问 #

229276次浏览 1761人参与

# 运营人求职交流聚集地 #

260156次浏览 1135人参与

# 秋招投递攻略 #

295986次浏览 2641人参与

# 你的mentor是什么样的人？ #

67170次浏览 852人参与

# 实习生至暗时刻 #

93645次浏览 942人参与

# 实习如何「偷」产出？ #

771832次浏览 8594人参与

# 从mentor身上学到了__ #

67709次浏览 949人参与

# 父母对你找工作是助力还是阻力？ #

52599次浏览 467人参与

# 你觉得mentor喜欢什么样的实习生 #

64148次浏览 1090人参与

# 我和mentor的爱恨情仇 #

121563次浏览 1047人参与

# 非技术投递记录 #

741604次浏览 6979人参与

# 找实习记录 #

282400次浏览 1664人参与

# 第一次找实习，我建议__ #

89973次浏览 923人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务