03-07 20:40 门头沟学院推荐算法

关注

大模型Agent校招面经-阿里淘天

继续来分享下之前的面经~欢迎友好讨论，信息共享
1. Transformer中Attention的本质是什么？你能从数学角度简要解释一下吗？
2. 在Agent多轮对话任务中，你觉得Attention的局限性体现在哪些方面？
3. 简要介绍一下SFT的核心流程，以及数据集的构建策略，SFT之后常见的Post-Training还有哪些？它们之间的目的有何区别？
4. 什么是RAG，它是怎么提升生成质量的？与传统检索＋模型生成的流程有何不同？如何评估一个RAG系统是否work的？
5. PPO和DPO在大模型对齐中的主要区别是什么？DPO训练通常有哪些注意事项？用过GRPO么？
6. 项目里的Modular Agent，你能讲讲它是如何实现多步规划的吗？
7. 项目提到了多个工具调用链路，调度策略是如何设计的？是否有异常fallback策略？
8. Agent评估体系包括哪些维度？如何衡量planning能力 vs hallucination rate？
9. 项目里微调Qwen，选择的训练阶段和Loss函数是如何决定的？
10. Prompt自动推荐模块用了哪些优化策略？有没有尝试过Prompt压缩或embedding表示的方式？
11. 场景题：假如一个Agent 推理链路包含3个工具+高频请求，系统整体延迟较高，你会如何优化？
12. 代码：岛屿数量

全部评论

推荐最新楼层

03-12 11:08

吉林农业大学算法工程师

AI-Agent 面试题汇总 - 大模型进阶面

1. 什么是生成式大模型？生成式大模型，就是在海量数据上训练出来，能够根据输入内容继续生成文本、代码、摘要、问答结果的一类模型。它不是去数据库里“查原句”，而是根据上下文，一个 token 一个 token 往后预测，所以它能生成新的内容。现在主流大模型大多是 Transformer 架构，尤其是 Decoder-only 这一类。因为这种结构天然适合做连续生成，训练目标和推理方式也比较统一。常见的生成式大模型有 GPT、LLaMA、Qwen、ChatGLM、DeepSeek 这些。2. 大模型为什么生成的文本能比较丰富，不会特别死板？核心原因有两个，一个是训练数据足够大，另一个是推理时不会每...

AI-Agent面试实战...

点赞评论收藏

分享

03-10 16:55

门头沟学院人工智能

阿里Agent开发校招一面攒人品

发一下问题给大家参考，攒攒人品！有面试过同岗的朋友欢迎评论区交流1.实习拷打2.项目拷打3.处理查询文档里的异构数据(如图片)时，具体的处理流程是什么?解析成纯文字后如何进一步加工?这样只返回文字给用户，图片信息不会丢失吗?4.你们是通过人工打标建立图片和文本的对应关系吗?文档量很大的情况下，打标工作能完成吗?5.如何保证大部分图片异构数据解析后回答的正确性?若回答错误，怎么识别问题?后续要验证回答准确性，你有什么方案?6.用于评测的另一个大模型，如何构造问题、分析文字并进行对比?这个大模型的正确率以及模型自我一致性怎么确定?7.你们的模型基于哪些异构图像做增强?模型会不会产生幻觉，生成文档外的内容?8.若用户的问题不在文档里，你们会怎么处理?是调用其他模型吗?大模型回答不了时，会提示用户补充问题吗?用户补充后仍无法解决该怎么办?模型如何判断何时需要让用户补充提问?9.你们有框架编排这些流程吗?用的是什么框架?10.怎么理解检索召回率?这些指标具体包含哪些评价项?什么是忠实度?召回率的分子分母是怎么定义的?11.你之前那段实习的具体工作内容是什么?针对设备故障叙述报告这类复杂文本，模型如何理解?是做了相关检测吗?大模型是怎么实现术语解释的?12.请讲一下LoRA技术，除了减少参数量，它还有什么优点?你做的LoRA相关工作，后续有落地应用吗?13.你写代码主要用Python吗?会不会用Java?了解Java的多线程、双亲委派模型以及消息中间件吗?有没有做过Java相关项目?

点赞评论收藏

分享

03-18 00:46

吉林农业大学算法工程师

CVTE AI Agent开发二面

1、自我介绍2、如果让你设计一个可回放、可调试、可审计的 Agent Runtime，你会怎么做一个真正能在线上稳定运行的 Agent Runtime，不应该只是“模型 + 工具调用”这么简单，而应该是一个有状态机、有事件日志、有回放能力的执行系统。我会把它拆成几个核心模块：任务上下文、Planner、Executor、Tool Adapter、State Store、Event Log、Policy Engine 和 Replay Engine。任务执行时，不是把所有中间过程都放在 Prompt 里，而是把关键状态结构化存储。比如当前步骤、已完成动作、失败次数、工具返回摘要、等待确认事项、上...

AI-Agent面试实战...

点赞评论收藏

分享

03-07 11:20

门头沟学院机器学习

AI Agent淘天实习一面攒人品

继续来分享下之前的面经~欢迎友好讨论，信息共享1.请详细介绍一下Transformer的架构，包括Encoder和Decoder的区别？2.解释LayerNorm和BatchNorm的区别，为什么Transformer中使用LayerNorm？3.多头注意力机制的原理是什么？为什么要用多头而不是单头？4.LLaMA的结构有什么特点？与标准Transformer有什么不同？5.什么是位置编码？绝对位置编码和相对位置编码的区别是什么？6.大模型训练中的灾难性遗忘是什么？有哪些解决方法？7.大模型训练中数据量和数据质量哪个更重要？为什么？8.DeepFM的原理是什么？FM部分如何降低计算复杂度？9.你在项目中遇到过拟合的情况吗？是如何解决的？10.手撕代码：重排链表（LeetCode 143）

点赞评论收藏

分享

03-08 20:25

门头沟学院后端工程师

转码选手的寻找暑期实习之路（3）-Shopee虾皮后端日常一面

自我介绍如何理解Mysql中的事务？对于Java内存模型是否有了解？JUC并发编程中的数据结构用到过哪些？是否有JVM调优经验？Mysql中有一个表，有a,b,c三列，b是索引，a是主键，当where b = 1时，要经历多少次IO？Mysql中聚簇索引和非聚簇索引的区别？如果出现慢SQL了怎么查看执行计划？项目中用到的RAG有哪些了解？对于分布式锁有哪些了解？如何用redis实现分布式锁？对于垃圾回收是否有了解？手撕 最长的不包含重复字符的子字符串感觉对于Mysql与Redis的询问更多，需要自我加强！

点赞评论收藏

分享

评论

1

11

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 如何一边实习一边找下家？ #

30377次浏览 212人参与

# 职能管理面试记录 #

9189次浏览 41人参与

# MiniMax求职进展汇总 #

14786次浏览 234人参与

# 跟HR说什么能被秒回？ #

9239次浏览 163人参与

# 一人说一个提前实习的好处 #

114976次浏览 702人参与

# 春招/暑实第一面是哪家？ #

19604次浏览 223人参与

# 巨人网络春招 #

10057次浏览 163人参与

# 面试官最爱问的 AI 问题是...... #

15879次浏览 547人参与

# 京东美团大战，你怎么看？ #

174077次浏览 881人参与

# 京东开奖 #

673229次浏览 3236人参与

# 你的嫡系AI是哪个？ #

4208次浏览 103人参与

# 现在入门AI应该走哪些方向？ #

4225次浏览 91人参与

# 把自己当AI，现在最消耗你token的问题是什么？ #

2891次浏览 85人参与

# 你收到了哪些公司的笔试？ #

17241次浏览 91人参与

# 巨人网络工作体验 #

74241次浏览 505人参与

# 巨人网络求职进展汇总 #

190734次浏览 1228人参与

# OPPO求职进展汇总 #

789678次浏览 5414人参与

# 2023届毁约公司名单 #

247692次浏览 1068人参与

# 实习生如何通过转正 #

129897次浏览 1475人参与

# 不卡学历的大厂有哪些？ #

161488次浏览 685人参与

# 你现在的工作，是“成长”还是“消耗”？ #

8312次浏览 146人参与

# 迅雷笔试 #

5426次浏览 27人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务