算法工程师精选面经合集
11家公司
47篇面经
最新 热门
/discuss/800421721529442304/discuss/800421500351164416/discuss/800420685318250496/discuss/800417961130409984/discuss/800417790514442240/discuss/800417492991496192/discuss/800417287118340096/discuss/800416663328796672/discuss/800415179342143488
滴滴-自动驾驶感知算法-面经
时间线:0728一面二面-0731三面-0918意向一面:1.自我介绍(3min)2.实习经历1(30min)(1)介绍一下你实现的Sparse Occ的方法(连同BEV多任务的架构)(2)得到BEV的方式(自顶向下,自底向上),相机内外参细节,相机畸变参数和畸变类型(3)voxel级别Occ预测的方式(channel 直接分出height,再卷积),没答出来,没怎么理解这个,虽然很简单(4)介绍了一下OccFormer(5)实习过程种遇到什么问题,还有没有讲到的吗,可以交流3.实习经历2(30min)(1)说了下红绿灯方案背景,介绍了一二阶段,以及上一代红绿灯方案(2)读秒feature的实现,为什么不直接2D然后基于规则来出(基于规则和基于模型的优缺点)(3)提升主要来自于哪里(结合和之前方法的对比+数据的迭代)(4)展开说一说端到端自回归世界模型预训练,自回归监督微调,强化学习微调)4.代码题(10min)(1)给出一些路径,求出最简化的路径,python.normpath API的实现(c++)二面:1.自我介绍(3min)2.实习经历1(20min)(1)OPUS模型,动机(体素级建模耗时,channel2height的方式对于小目标和悬空障碍物不友好),方法,同样从背景介绍了Occ整体结构(2)为什么选择OPUS(方法精简,好迁移,部署方便)(3)基于原模型改动的3个点(预测instance,empty监督,场景与instance分开->BEV cross attention)(4)sparse方式->sparse4D,稀疏采样方式,具体怎么做的(5)有哪些时序融合方式,总结一下3.实习经历2(20min)(1)红绿灯方案简介,巴拉巴拉(2)二阶段训练方式(一阶段fix住后,要训哪些参数),二阶段包含哪些信息,Backbone共享,一开始的这个backbone参数怎么来的?(3)红绿灯先验(没什么强先验,主要是针对小目标以及密集目标),正负样本匹配(阈值,ATSS,OTA,SimOTA,FCOS用的哪个)4.代码题(10min)(1)IoU实现(c++)三面:1.自我介绍(5min)2.实习经历1(20min)(1)模型整体背景,动机,OPUS模型方法,选择的原因,基于原模型的改动(2)对于一些小的障碍物检出效果怎么样,塑料袋之类的(3)下游用行车Occ的情况,Bad case检出效果(4)了解真值数据怎么来的吗(5)工作地点/第一家公司的看法3. 反问(5min)
发面经攒人品
点赞 评论 收藏
分享
/feed/main/detail/d1a2b996ca5d433b8dfd71c5803d0764/feed/main/detail/f36afd6fea4e47b9a8ff0c1960830828/discuss/800395654106198016/discuss/800391738102657024/feed/main/detail/b462bb202cc84bfbb84884b073642152/feed/main/detail/e7848b7adc1e41c29047876d8c0830f3/discuss/800367562742644736
大模型RAG常见面试问题(附答案)
1️⃣RAG 有哪几个步骤?Step1:将文本分割成块;Step2:使用编码模型将这些块嵌入到向量中,将所有这些向量放入索引中;Step3:LLM 创建一个提示,告诉模型根据我们在搜索步骤中找到的上下文来回答用户的查询。2️⃣实际项目中RAG有哪些优化技巧?首先召回源会考虑多路召回,在召回后面增加一个重排序的阶段,提升召回的质量。另外,重排序模型以及生成模型会根据系统问答的指标情况,进一步微调。3️⃣RAG 中为什么会出现幻觉?出现幻觉问题主要分为两大类,一是生成结果与数据源不一致,训练数据和源数据不一致、数据没对齐或者编码器理解能力的缺陷导致;二是用户问题超出了大模型的认知,用户的问题不在语言模型认知范围内导致。4️⃣RAG 一般怎么做效果评估?RAG 做效果评估主要是针对检索和生成两个环节。对检索环节,我们可以采用 MRR 即平均倒排率,前 k 项的 Hits Rate 命中率, NDCG 排序指标等。生成环节首先是量化指标,再评估生成答案的多样性,看看模型是否能够生成多种合理且相关的答案。还需要引入人类评估,考虑资源效率。5️⃣针对幻觉的问题,有什么解决思路?加入一些纠偏规则,比如采用 ReAct 的思想,让大模型对输出的结果进行反思。还有一种思路是集成知识图谱,即不再局限于向量数据库匹配,做召回时不仅考虑文档块,同时还考虑图谱的三元组。将知识图谱( KGs )集成到 RAG 中,通过利用知识图谱中结构化且相互关联的数据,可以显著增强当前 RAG 系统的推理能力。6️⃣在实际做项目中,经常遇到各种边界的 case ,一般怎么解决?这个需要分情况来看,首先是无效问题:如果对于知识库中没有的问题,我们需要做一个准入的判别,判断是否需要回答。一般是一个二分类模型,或者直接用大模型+ prompt 来做,使模型在这种情况下输出一个预设的兜底话术。第二个是减少幻觉,在推理模块中添加规则和提示工程技术。还有一种是格式错误:模型可能会生成无法解析的答案,这种可以设计一个备份的代理大模型,当解析失败时,可以基于代理大模型直接生成简洁准确的总结。📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
查看6道真题和解析
点赞 评论 收藏
分享
/feed/main/detail/4366a6c83d1446ee844f4ab8af3fa25c/discuss/800093189624311808/discuss/800309056295469056/feed/main/detail/85fcd0c27a074229a1cb8d9fb458d8d4
玩命加载中
写面经
发动态
发动态
发帖子
写文章

全站热榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务