算法工程师精选面经合集
11家公司
41篇面经
最新 热门
/discuss/879382902981615616/feed/main/detail/bc0bdd2d3bca47db8228609d2faefbb8/feed/main/detail/65386c89ad924ea3b6739a30db8ba459/feed/main/detail/c6319266d65546409afa644e4e1bcc30/feed/main/detail/a323d35c49f64a97887ec58e18a05c77/feed/main/detail/a81072739ae6473fba6bc90dd63c74dc/feed/main/detail/d76e5e62a89546068ffebd6d3bf47265
04-30 12:02
门头沟学院 Java
腾讯ai应用开发日常实习二面分享 1h
攒人品中,祝大家都能拿到满意的Offer!1、你们团队的multi-agents是你自己设计的?还是你只是完成了其中的一部分?2、所以你只是做了,没有参与底层设计对吧,讲讲你在团队里日常都做什么?3、你门团队的agent端到端成功率和工具误调用率是怎么量化的?用了什么工具?怎么去进行改进的?4、我看你还有做医学语料的预处理工作,这块你们是怎么分工的?5、你刚才讲了那么多步骤,所有工作都是你一个人完成的吗?或者说你主要负责哪几个环节6、论文有很多不同的形式,你在做layout-aware parsing的时候,具体用的哪个工具去解析pdf?有没有横向对比其他工具?7、噪声剔除的工作你平时是怎么做的?技术方案是什么?能不能详细讲一下8、有多篇文章出现了重复片段,你是怎么去识别并归纳的?9、业界对chunk切分和边界修正的主流策略是什么?10、假设我现在有一个表格被切分成了两半,你怎么在众多paper中找到并纠错?11、你们做的Graph RAG用了什么工具去进行评价?12、你说的这个Graph里的三元组使用LLM去进行抽取的吗?怎么保证大模型不会因上下文过长而出现幻觉?13、那你在设计三元组的时候是人工操作还是AI?有没有用到学术界提供的映射表之类的?14、假设大模型在抽取实体的时候出现错误了,你怎么去排查?15、我看你有在Graph RAG基础上做community summary,讲一下你这个设计思路16、你怎么看待你做的这个图检索增强生成,和市面上常见的向量检索、混合检索有什么区别?17、不同的RAG有做横向对比并量化成效吗?笔试题:用AI IDE写一个工具,语言不限,要求是能准确的从给定文本提炼出关键实体,并把对应的entity、relationship、claim用标准json形式输出。
查看17道真题和解析
点赞 评论 收藏
分享
/feed/main/detail/98687348b95f4f61b3e7edbc631a7790/feed/main/detail/6c43b9af3aa944c8b2bfff5c06b7e63c/feed/main/detail/a3ab6ab688e5472789e7b0b0e3bc1e8d/feed/main/detail/db5f446b744f4bb28d26a63c7f1610db/feed/main/detail/ad22a4b4908848519a72f8c94925c081/feed/main/detail/e88babcd204e431d8a5d6e1a560b7923/feed/main/detail/be29f78d1c174fe2ab2af85f89f6b792
04-30 05:20
门头沟学院 Java
暑期阿里淘天AI应用研发一面 夯爆了版
继续来分享下最近的面经~欢迎友好讨论,信息共享1. 实习拷打2. 在RAG系统中,它一般的召回阶段的排序策略通常有哪些?如果一个用户在召回的时候,他的查询是一些长尾或者是语义模糊的关键词,你怎么去提升这个召回的准确率?3. 召回排序的过程有几个阶段或几个层次?4. 有哪些方式可以改写Query,为什么能够提升这个召回精准度?5. RRF融合中,它的K参数一般取值是多少?大一点、小一点对结果有什么影响?6. 在你的项目里面,实际召回中有遇到不准的情况吗?在你们这个提升准确率的过程中,你们去做了哪些事情去提升,怎么做?7. 如果在查询中间,输入的一些极其模糊的表达,在实际工程中间要怎么去做呢?8. 那如果要做这么一个AI,你具体怎么去提示他,怎么去做?遇到这种一次性说不清楚话的用户,那你这个agent怎么去解决这一类的问题?9. 怎么去降低整个项目的一个幻觉?从数据、检索和生成这三个方面去阐述一下10. Agent项目如何设计评测方案11. 后端压测性能优化,如何定位问题之后是两个场景题:1. 假如需要你去设计一个电商客服agent的评测方案。这个agent主要有三类任务:商品咨询、售后咨询、还有投诉安抚。你需要去设计一个完整的评价系统,主要包括测评的维度指标,以及数据集的构成构建方案。然后如何区分这个agent到底是好还是坏,你怎么去设计?比如说我们就开发了一个这样的客服系统跑在线上,你总得有一些衡量的指标,你怎么去建这个衡量指标,怎么得出来这个agent是比较好的、比较提效的?比如说在安抚这个场景,用户的满意度是很难去衡量的,那你需要假如说让你设计一些指标,或选取一些指标去衡量用户是否满意,你觉得怎么去提取或者是设计这个指标?2. 假如让你负责一个文本转SQL的模型训练集的构建,你只有500条真实标注样本,需要你去覆盖200多个查询模式(单表查询、多表连接、聚合查询等等),需要你设计一个完整的数据生产流,包括合成策略、怎么控制质量,以及怎么去迭代优化,你怎么去设计?再之后是两道ai coding
查看12道真题和解析
点赞 评论 收藏
分享
/feed/main/detail/14987a3289584fdc839c890dda51913a
阿里淘天 AI Agent应用开发 二面面经
一、自我介绍二、项目深度拷问一(多模态相关项目)1. 项目中针对图文模态对齐问题,具体采用了哪些技术方案解决?2. 若图纸类视觉内容在文本中无任何对应描述,模型如何依托视觉特征实现精准内容召回?3. 项目向量数据库Milvus中,选用了哪类索引算法,选择该算法的核心依据是什么?4. 针对专业术语出现语义偏移的问题,除了混合检索方案,是否尝试过Embedding模型微调、Adapter适配等优化方式?具体落地思路是怎样的?三、项目深度拷问二(Agent对话/画像项目)1. 当外部测评工具返回的原始数据格式,与大模型输入预期格式不匹配时,如何实现数据格式的自动化映射?2. 向量库检索出的用户长期画像数据,与当前实时会话状态产生冲突时,整套系统的处理逻辑和解决方案是什么?3. 如何避免模型回复过度依赖检索到的外部知识,导致回答生硬、缺乏共情能力,提升对话自然度?四、AI Agent核心技术原理1. 对比思维链(CoT),ReAct范式在模型与外部环境交互过程中,核心解决了哪些痛点问题?2. 详细阐述大模型实现函数调用(Function Call)的完整流程,模型是如何将自然语言语义转化为标准化结构化参数的?3. 实际开发过程中,如何判断一个任务适合采用固定Workflow流程,还是自主决策型Agent来实现?五、Agent记忆与检索优化1. 详细讲解Agent系统中长短期记忆的设计逻辑,在长时对话场景下,如何实现上下文信息的动态压缩与选择性遗忘?2. 在Agent系统架构中,RAG检索获取的外部知识,是如何精准输入给模型,同时避免无关知识对模型输出产生干扰的?3. 解释重排序(Rerank)技术的定义,它在Agent检索链路中,对提升模型最终决策准确性起到哪些关键作用?六、多Agent与人机协作1. 单Agent处理复杂长周期任务时,引入多智能体(Multi Agent)架构的核心优势有哪些?2. Multi Agent系统中的路由(Router)节点,依据哪些规则和逻辑,将任务分发给对应的子Agent?3. 什么是人在回路(Human-in-the-loop)机制?在Agent系统开发中,如何合理设计人工审批断点,保障系统运行可靠性?七、系统评估与性能优化1. 有哪些量化评估方式,可以衡量一套Agent系统的优劣?2. 除模型生成质量外,Agent系统还需要重点关注哪些维度的评估指标?3. 针对Agent多步推理过程中产生的响应延迟问题,可落地的优化方法有哪些?4. 随着大模型上下文窗口持续扩容,传统RAG技术是否会被完全替代?阐述你的核心观点及理由。
查看20道真题和解析
点赞 评论 收藏
分享
/feed/main/detail/634e8a4cd4654496aa36a9eb1873ee4e
阿里淘天 AI Agent应用开发 二面面经
一、自我介绍二、项目深度拷问一(多模态相关项目)1. 项目中针对图文模态对齐问题,具体采用了哪些技术方案解决?2. 若图纸类视觉内容在文本中无任何对应描述,模型如何依托视觉特征实现精准内容召回?3. 项目向量数据库Milvus中,选用了哪类索引算法,选择该算法的核心依据是什么?4. 针对专业术语出现语义偏移的问题,除了混合检索方案,是否尝试过Embedding模型微调、Adapter适配等优化方式?具体落地思路是怎样的?三、项目深度拷问二(Agent对话/画像项目)1. 当外部测评工具返回的原始数据格式,与大模型输入预期格式不匹配时,如何实现数据格式的自动化映射?2. 向量库检索出的用户长期画像数据,与当前实时会话状态产生冲突时,整套系统的处理逻辑和解决方案是什么?3. 如何避免模型回复过度依赖检索到的外部知识,导致回答生硬、缺乏共情能力,提升对话自然度?四、AI Agent核心技术原理1. 对比思维链(CoT),ReAct范式在模型与外部环境交互过程中,核心解决了哪些痛点问题?2. 详细阐述大模型实现函数调用(Function Call)的完整流程,模型是如何将自然语言语义转化为标准化结构化参数的?3. 实际开发过程中,如何判断一个任务适合采用固定Workflow流程,还是自主决策型Agent来实现?五、Agent记忆与检索优化1. 详细讲解Agent系统中长短期记忆的设计逻辑,在长时对话场景下,如何实现上下文信息的动态压缩与选择性遗忘?2. 在Agent系统架构中,RAG检索获取的外部知识,是如何精准输入给模型,同时避免无关知识对模型输出产生干扰的?3. 解释重排序(Rerank)技术的定义,它在Agent检索链路中,对提升模型最终决策准确性起到哪些关键作用?六、多Agent与人机协作1. 单Agent处理复杂长周期任务时,引入多智能体(Multi Agent)架构的核心优势有哪些?2. Multi Agent系统中的路由(Router)节点,依据哪些规则和逻辑,将任务分发给对应的子Agent?3. 什么是人在回路(Human-in-the-loop)机制?在Agent系统开发中,如何合理设计人工审批断点,保障系统运行可靠性?七、系统评估与性能优化1. 有哪些量化评估方式,可以衡量一套Agent系统的优劣?2. 除模型生成质量外,Agent系统还需要重点关注哪些维度的评估指标?3. 针对Agent多步推理过程中产生的响应延迟问题,可落地的优化方法有哪些?4. 随着大模型上下文窗口持续扩容,传统RAG技术是否会被完全替代?阐述你的核心观点及理由。
查看20道真题和解析
点赞 评论 收藏
分享
/feed/main/detail/fac28b92963047aca5d6dafae55d1a3d
头像
04-29 22:28
门头沟学院 Java
饿了么ai开发一面
1. 使用线程池时,相关参数怎么设置的2. 高并发缓存场景下,你如何设计缓存更新策略来平衡数据一致性与服务性能?3. 多节点状态同步场景中,你如何处理数据同步的一致性与延迟问题?4. 用策略模式重构分支逻辑时,你如何保证新旧逻辑的兼容性,避免业务中断?5. 多维度查询的缓存设计中,你如何平衡缓存Key复杂度、查询效率与内存占用?6. Redis分片解决大key问题后,你如何保证跨分片查询的效率?7. 优化Redis数据分布时,你用什么方法验证优化效果,判断数据分布是否均匀?8. 实现基于用户特征的个性化缓存查询时,如何处理缓存冷启动和过期问题?9. 优化首页接口耗时到毫秒级时,你用哪些工具定位性能瓶颈?10. 热点数据高并发访问场景下,缓存扣减加锁兜底方案如何保障极端场景的稳定性?11. 结合消息队列与定时任务削峰时,如何设计两者分工,避免消息丢失或重复消费?12. 基于Spring AI实现双大模型对接时,你如何设计模型降级与切换策略?13. 用问题-知识库联合提示提升RAG准确率时,提示词的迭代优化过程是怎样的?14. 处理多格式文档向量化时,如何避免长文本或复杂格式导致的语义信息丢失?15. 实现AI工作流驱动的自动化推送时,如何保证指令解析与执行的准确性?
查看15道真题和解析
点赞 评论 收藏
分享
/feed/main/detail/7c0770f5c1a644a7830fc5cae7732f64/feed/main/detail/f5e011b61bdc49d8bb5683b8bdb6fb31/discuss/879091601576886272
玩命加载中
写面经
发动态
发动态
发帖子
写文章

全站热榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务