百度视觉组一二面拷打攻略

百度视觉组的面试是真的硬核,面试官的水平真的比其他几个本人面的公司高一个level;自己的能力估计是大概率配不上这个岗

一面(100分钟)

eccv论文介绍,深挖深挖再深挖,每个模型的细节,数据集,甚至参数设置,性能优化都不放过; 延伸拓展怎么做成通用型架构/怎么融合natural language

多模态的一些模型介绍,clip,blip,albef,llava

coding: 写一个tranformer(pytorch可用)

二面(60分钟)

eccv论文,大致介绍,面试官明显更关注落地性,一直在追问落地可行性相关,推理加速,模型压缩可行性相关的问题(之前都没怎么关注过,直接给我问懵了😭);全程80%的时间都是面试官在介绍在讲,偶尔问了一些多模态大模型,讲了下cogview,Ernie(Ernie了解的也不多,属于是班门弄斧了)。

最后面试官问我有什么问题的时候我都不知道问啥了,大模型(尤其多模态的大模型)关注的确实太少,大概率是寄寄

by the way,这个面试官好像是从谷歌回来的,之前在Palm-E的组干过。我何德何能让他来面试的😭

#面经# #百度# #百度面试面经#
全部评论
视觉组是哪个组?自然语言处理部门下面的吗?
点赞 回复 分享
发布于 2024-07-19 00:37 广东
佬是专业cv,然后找工作转nlp吗? 我也想着转了, 感觉cv真没结果,现在所有公司招聘第一个都是啥啥啥大模型算法工程师
点赞 回复 分享
发布于 2024-07-05 20:41 黑龙江
这是实习生岗位?感觉很难
点赞 回复 分享
发布于 2024-06-17 18:57 英国
更新一下,我这破水平居然还能约三面?😰,百度是流程走完再一起综合排序吗
点赞 回复 分享
发布于 2024-06-15 13:14 广东

相关推荐

2025-12-02 15:13
门头沟学院 C++
算法岗越来越卷,还在纠结简历写什么? 拒绝千篇一律的“minist手写数字识别”! 今天盘点 3 个不同技术方向的硬核项目,建议根据自己的赛道,选一个死磕到底!👇1️⃣ 【LLM 应用赛道】—— 紧跟风口  📂 项目:基于 LangChain + RAG 的垂直领域问答助手为什么做: 现在 10 家面试 8 家问大模型。不懂 RAG(检索增强生成)真的很难聊!核心考点: 向量数据库 (Milvus/Faiss)、Prompt Engineering、文档切片策略、甚至 LoRA 微调。一句话亮点: “解决了大模型幻觉问题,实现了基于本地私有数据的精准问答。”2️⃣ 【硬核基建赛道】—— 专治手痒  📂 项目:从零手撸 Transformer (Pytorch复现)为什么做: 别只做“调包侠”!面试问 Multi-head Attention 细节又又又卡壳了?核心考点: Self-Attention 矩阵计算、Positional Encoding 原理、Mask 机制。一句话亮点: “不依赖高级 API,从底层张量运算构建模型,深入理解 Attention 机制。”3️⃣ 【AIGC 视觉赛道】—— 视觉魔法  📂 项目:Stable Diffusion 扩散模型复现与 LoRA 微调为什么做: CV 岗已经从“识别”卷到了“生成”。不要再玩那个YOLO !核心考点: DDPM/DDIM 采样原理、UNet 结构(mile-stone)、CLIP 多模态对齐、ControlNet 控制生成。一句话亮点: “掌握 AIGC 核心流派,具备模型微调与可控图像生成能力。”💡 最后的小建议: 项目在精不在多。 与其罗列 多 个 Demo,不如把其中一个吃透,把遇到的 Corner Case、性能优化、思考过程写进简历里。
一人推荐一个值得做的项目
点赞 评论 收藏
分享
评论
2
15
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务