26大模型算法校招面经--阿里

发一下问题给大家参考,攒攒人品!
1.Transformer中Attention的本质是什么?你能从数学角度简要解释一下吗?
2.在Agent多轮对话任务中,你觉得Attention的局限性体现在哪些方面?
3.简要介绍一下SFT的核心流程,以及数据集的构建策略,SFT之后常见的Post-Training还有哪些?它们之间的目的有何区别?
4.什么是RAG,它是怎么提升生成质量的?与传统检索+模型生成的流程有何不同?如何评估一个RAG系统是否work的?
5.PPO和DPO在大模型对齐中的主要区别是什么?DPO训练通常有哪些注意事项?用过GRPO么?
6.项目里的Modular Agent,你能讲讲它是如何实现多步规划的吗?
7.项目提到了多个工具调用链路,调度策略是如何设计的?是否有异常fallback策略?
8.Agent评估体系包括哪些维度?如何衡量planning能力 vs hallucination rate?
9.项目里微调Qwen,选择的训练阶段和Loss函数是如何决定的?
10.Prompt自动推荐模块用了哪些优化策略?有没有尝试过Prompt压缩或embedding表示的方式?
11.场景题:假如一个Agent 推理链路包含3个工具+高频请求,系统整体延迟较高,你会如何优化?
12.代码:岛屿数量
全部评论

相关推荐

04-09 14:48
门头沟学院 Java
自我介绍 Java 语言基础1、说说 Java 的内存模型?堆和栈的区别是什么?存对象、栈存...2、HashMap的底层实现讲一下?1.7和1.8有什 么区别?3、ConcurrentHashMap呢?它是怎么保证线程安全的?4、线程池的核心参数有哪些?拒绝策略有几种?5、synchronized和ReentrantLock的区别? 什么场景下用哪个?6、Java的动态代理有几种方式?Agent框架?项目深挖Spring 框架1、Spring Boot 的自动装配原理?2、Spring 的 IoC 容器启动流程?Bean 的生命周期是怎样的?3、MySQL 的索引结构是什么?为什么用 B+ 树而不是 B 树或哈希表?4、@Autowired和@Resource的区别?缓存数据存储1、Redis的常用数据类型有哪些?分别适用什么场景?String, Hash, List, Se ...2、Redis的过期策略和内存淘汰机制了解吗?过期策略说了惰性删除和定期 ...3、缓存穿透、缓存击穿、缓存雪崩分别是什么? 怎么解决?4、Redis和MySQL的数据一致性怎么保证?了解哪些方案?5、MySQL的索引结构是什么?为什么用B+树而 不是B树或哈希表?6、慢SQL怎么排查和优化?AI Agent 核心1、了解哪些 Agent 的架构模式?2、Function Calling 的原理是什么?你怎么理解 Tool Use?3、如果大模型返回的 Function Call 参数格式不对怎么办?4、了解 MCP(Model Context Protocol)吗?它和现在框架里的 Tool 注册机制有什么区别?5、有了解过多 Agent 协作吗?比如 Google 的 A2A 协议或者 Multi-Agent 系统的设计模式?算法题1、给定一个整数数组和一个滑动窗口大小 k,返回每个窗口中的最大值。
查看21道真题和解析
点赞 评论 收藏
分享
04-10 02:40
门头沟学院 Java
给我面没招了,发点面经攒攒人品~1.项目拷打2.你在这个 RAG 系统优化里面,在多阶段 RAG 系统中采用了 BM25 和向量混合检索,然后这个是怎么去设计两者的结合逻辑的?然后混合策略的话具体是如何去提升检索效果的?3.RAG支持 PDF 扫描件和 OCR,然后还有表格结构化的提取,然后在这过程中有没有遇到什么技术难点?4.识别准确率怎么样?5.这个多智能体系统设计里面,然后它的这个 State 管理和Checkpoint分配机制的具体实现方式是什么?怎么去解决对话执行中的状态竞争问题呢?6.怎么样实现 State 全局管理?7.将Choice 接口封装为MCP工具的时候,怎么去设计一个标准化接口?然后遇到有没有遇到过一些兼容性的挑战?8.举了项目里的一个例子,问我出参入参是怎么去定义的?9.大模型在调用这个工具的时候,比如说有 MCP 之前,它的调用的处理流程是什么样子的?10.或者说 MCP 它有哪些缺点或者挑战呢?11.提供的这个 MCP 的结果它是流式的吗?12.这个多agent项目是主子agent的项目吗?13.其中一个功能,然后它的 token 就是一次会话 token 大概有多少?有没有超过上限?14.模型用的哪个?我答Qwen,问我Qwen具体哪个版本15.在子任务过程中啊,如果它的某个子任务失败,比如说数据获取为空,它的这个整个工作流是怎么去重试或者是降级处理的?16.在实现这个流式输出实现的时候,比如说后端用了 FastAPI 和 SSE 来实现中间结果的实时流式输出。然后在这个 Langchain 这种基于图的状态机框架中,是怎么捕获每个 node 的执行结果,然后推送到前端的?17.LangGraph 和Langchain 为什么选择了 LangGraph 没有选择简单的那个 Langchain 呢?18.Checkpoint 的持久化19.对话之后重新连接的话,是怎么能够恢复到之前的那个状态呢?20.对话持久化的话,是存储到哪里的?是存储到内存里面,还是存到硬盘上面去的?21.关于 RAG 的,向量数据库在选择建索引的时候是用了哪种向量数据库?为什么?22.这里面你提到了 RRF 重排序,然后有没有引入什么模型进行精排?
查看22道真题和解析
点赞 评论 收藏
分享
评论
2
9
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务