秋招百度搜索算法提前批

📍面试公司:百度,base北京

🕐面试时间:一面8.14,二面8.20

💻面试岗位:垂类搜索算法工程师

❓面试问题:

一面,时长45min

主要是简历+八股+手撕一题

1.自我介绍

2.简历上的项目从头开始问并结合八股

3.CLIP模型的结构、损失函数、CLIP与其他计算机视觉模型相比的区别、CLIP的image encoder和text encoder用了什么模型

4.transformer模型架构,自注意力机制公式、transformer和resnet相比的区别

5.实习内容,稀疏检索

6.rag流程

7.学习或者项目过程中遇到的困难如何解决的

8.反问

手撕的是随机从力扣上选一道题,偏简单难度的,然后讲解一下代码思路并且询问时间复杂度和空间复杂度

🙌面试感想:整体一面流程还是很顺畅的,面试官人很好,不会问太难的问题或者八股,主要都是结合简历来介绍,大概面了45min左右,看看二面会不会上强度吧

有没有家人们了解这个岗位的呀,我投的不是这个但是被调剂到这里,这个岗位可以去吗

二面,时长1h

一面的第二天打电话通知二面

1.自我介绍

2.简历上项目介绍,对实习内容拷打比较多,比较关注实习产出

3.场景题,这个答的不太好,面试的岗位是做纯文本搜索检索的,考察文本二分类或者文本检索模型,这个方面不太了解,回答不出来

4.手撕力扣回溯

5.反问

蹲一个三面吧,感觉二面有点要凉凉,反问的时候问了部门具体做什么的,面试官大概介绍了一下之后总结了一句我们确实没有做多模态的,感觉听到这句话可能有点凉了,岗位匹配度好像不够,球球了给我个三面吧

凉了

#面试问题记录##给26届的秋招建议##应届生初入职场,求建议#
全部评论

相关推荐

后端开发/AI工程实习生 - 技术一面面试问题速览1. 请做个自我介绍。2. (针对RAG项目)为什么选择用Elasticsearch来做存储?3. Elasticsearch和其它常规的向量数据库有什么不一样的地方?4. (针对AI Agent项目)整个Agent你是怎么去设计的?5. (针对多轮对话)持久对话是怎么实现的?6. 了解CAP理论吗?Redis属于哪一种?7. (针对分布式项目)怎么去选一个leader节点?(Raft协议)8. (针对后端项目)你这边用了一个RocketMQ,能简单说一说这种消息队列有什么用,具体用在什么场景?9. (个人情况)现在是开学到大三是吧?实习时间大概是多少?我的回答策略与复盘【针对问题】RAG项目中为何选择Elasticsearch?它和专用向量数据库有何不同?* 【回答策略】我主要从两个层面回答了这个问题:1. 工程实践角度:强调了基于已有技术栈和经验进行选型的务实考量。比如,我提到自己熟悉ES,且团队已有的ELK生态便于集成和运维,这展示了成本和效率意识。2. 技术特性角度:点出了ES的核心优势在于其综合搜索能力。我解释了它不仅支持向量搜索,还能利用其强大的倒排索引进行传统的关键词检索,这对于需要结合多种搜索方式的场景非常有利。* 【复盘与思考】* 亮点:面试官对我从工程实践角度出发的回答表示了认可,这表明在初创公司,务实和快速落地的能力很受重视。* 待优化:现在回想,我的回答应该优先强调技术优势。比如,可以更专业地指出ES的“混合搜索(Hybrid Search)”能力是其在RAG场景下相比Milvus等专用向量库的核心差异点和优势。先说技术核心,再说工程便利性,逻辑会更清晰。【针对问题】如何设计一个AI Agent?* 【回答策略】我将Agent的设计思路拆分成了两个核心部分:1. 核心大脑(LLM & Prompt Engineering):讲解了如何通过精心设计的提示词工程(Prompt)来赋予Agent“专家角色”,并引导其进行多轮、有逻辑的提问,而不是一次性给出所有答案。2. 知识外挂(RAG):详细说明了如何通过检索增强生成(RAG)技术为Agent挂载外部知识库,确保回答的专业性和准确性,避免模型幻觉。同时,我还提到了对原始数据(如PDF论文)进行清洗、切块和向量化的预处理流程。* 【复盘与思考】* 亮点:这个回答展示了系统性思维,将一个复杂问题拆解成了具体的技术模块,并且每个模块都有清晰的实现思路。特别是提到了数据预处理的细节,增加了回答的深度。* 待优化:可以进一步引入Tool Calling/Function Calling的概念,说明Agent如何调用外部API(如查询天气、数据库)来增强其能力,这样会让设计显得更完整和前沿。【针对问题】Raft协议的Leader选举过程是怎样的?* 【回答策略】因为这是我亲手实现过的项目,所以我非常有信心地按照时间线和状态机转换的逻辑,一步步地阐述了整个流程:1. 触发条件:从Follower收不到Leader的心跳超时开始讲起。2. 状态转换:描述节点如何将自己的term加一,并转变为Candidate状态。3. 选举过程:讲解Candidate如何向其他节点发起投票请求。4. 达成共识:强调需要获得超过半数的选票才能成为新的Leader。5. 新王登基:说明新Leader会立即发送心跳给所有Follower,以巩固自己的地位。* 【复盘与思考】* 亮点:这是本场面试回答得最好的问题。清晰的逻辑、准确的术语、自信的表达,强有力地证明了我的动手能力和对分布式协议的深刻理解。对于简历上的核心项目,一定要做到这个熟悉程度。【针对问题】消息队列(RocketMQ)用在什么场景,解决了什么问题?* 【回答策略】我没有泛泛地谈理论,而是直接用了一个项目中的具体场景——“大数据量异步导出”——来回答,遵循了经典的STAR原则:* (S)场景:用户请求导出大量数据,同步处理会导致页面长时间等待,甚至请求超时。* (T)任务:优化用户体验,同时避免后端服务因长时间重度计算而崩溃。* (A)行动:引入RocketMQ。Web服务接收到请求后,立即返回“处理中”的响应,并将导出任务作为一个消息扔进队列。后端有一个专门的消费服务去队列里取任务,慢慢处理。* (R)结果:实现了异步化,前端响应速度极快;同时起到了削峰填谷的作用,保护了后端服务,提升了系统的稳定性和吞吐量。* 【复盘与思考】* 亮点:用一个具体的业务故事来包装技术,非常有说服力。这展示了我不仅懂技术,更懂得如何用技术解决实际的业务痛点,这是面试中非常重要的加分项。
查看18道真题和解析
点赞 评论 收藏
分享
[后端/AI工程实习生] - [CEO面](oc已拒)面试问题速览1. 请简单介绍一下自己。2. 你是从什么时候开始接触编程的?第一个项目是什么时候做的?3. 看你简历上提到了Go语言,可以讲讲它的优劣吗?4. 你提到用Python做过模型微调,可以具体讲讲吗?(基于什么模型、用了多少数据等)5. (深挖RAG项目)可以详细介绍一下你在智慧农业项目中RAG问答引擎的实现方案吗?为什么选择将PDF转为Markdown再处理,而不是直接用框架提供的工具?6. (压力面/追问)RAG的局限性是什么?请举一个具体的负面例子,在什么场景下RAG并不能解决得很好?7. 你对未来的技术方向有什么规划?更倾向于Java后端还是AI工程?8. 考虑到你还在校,如何安排实习时间以确保投入度?我的回答策略与分析【针对问题】:Go语言的优劣势分析【我的回答策略】我重点阐述了Go语言在并发处理上的核心优势,提到了goroutine的轻量级特性和基于channel的CSP并发模型,并强调了它在高并发场景下相对于传统多线程模型的低开销。【回答分析】亮点:准确抓住了Go的核心特性,并提及了关键技术goroutine和channel。复盘反思:这是一个明显的失分点。面试官问的是“优劣”,而我只答了“优”没答“劣”,这会显得对技术的理解不够全面和辩证。改进建议:面试前应准备好技术的两面性。对于Go,可以补充几点不足,例如:1. 错误处理机制(大量的if err != nil)相对繁琐;2. 依赖管理在go mod出现前比较混乱;3. 泛型支持较晚,在某些场景下代码复用性不如Java。最好能结合与Java线程模型的对比,更能体现思考深度。【针对问题】:RAG技术的局限性,并要求举出具体的负面案例【我的回答策略】我首先从理论层面切入,提出RAG依赖向量相似度检索,如果关键信息不包含明确的关键词或语义关联较弱时,可能会检索失败。但在面试官的持续追问下,我未能主动给出一个具体、有说服力的负面应用场景。【回答分析】亮点:在压力下没有放弃思考,尝试跟上面试官的思路。复盘反思:这是本次面试的最大挑战和暴露出的主要不足。我的回答暴露了对技术的理解更多停留在“如何实现”,而缺乏对“技术边界和失效场景”的深入思考。这道题的本质是考察候选人的批判性思维和技术深度。改进建议:对于这类开放性问题,一定要提前准备具体、有画面感的例子。复盘后,我认为以下几个RAG的负面案例会是更好的回答:1. 多跳推理问题:当一个问题的答案需要结合多个独立的知识片段进行逻辑推理才能得出时,单次检索召回的上下文很可能是不完备的。2. 精确统计与计算:例如提问“知识库中关于‘A项目’的文档,过去三个月更新了多少次?” RAG无法执行计数或精确计算。3. 非结构化数据中的隐含关系:例如,无法直接回答“A和B两位作者合作过几篇论文?”除非知识库中有直接陈述这个事实的文本。4. 反事实或否定性问题:例如提问“请给我念一首你知识库里没有的诗”,RAG的机制决定了它无法处理这种“在不存在中寻找”的问题。
查看8道真题和解析
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务