淘天AI Agent暑期实习一面

攒攒人品!有面试过同岗的朋友欢迎评论区交流
1.讲一下 Transformer 架构原理以及最新进展
2.介绍 Transformer 后续发展的两个流派:Encoder 和 Decoder
3.为什么现在的大模型都是 Decoder-only
4.讲一下实习工作
5.怎么量化可视化 Prompt 对决策能力的干扰权重
6.如何判断是可视化 Prompt 内容影响决策,还是 Prompt 太长导致注意力涣散影响决策
7.怎么设计实验验证这个问题
8.讲一下正负样例是怎么构造的
9.训练集是怎么构造的
10.训练过程中有没有遇到训练后效果变差的问题
11.遇到问题后怎么解决
12.如何理解压缩专家向量
13.讲一下怎么做分阶段训练
14.为什么要分阶段训练
15.开放性问题:如果训练一个 AI Coding Agent,是端到端训练还是分阶段训练
16.讲一下 GRPO、DPO、PPO 三种算法,以及各自适用场景
17.开放性问题:如果要训练一个数学推理的小多模态模型,同时有一个纯文本推理能力强的大模型,你会怎么做蒸馏
18.如果没有图片,只有纯文本,怎么设计训练方案
19.让你设计一个AI Coding Agent 你会 怎么设计
20.后续怎么去评测这个 Agent
全部评论

相关推荐

不愿透露姓名的神秘牛友
04-30 17:45
本人简历上 1 个 RAG 项目 + 1 个 Agent demo;这次面的是AI岗一面前我以为:背完八股 + 把项目讲清楚,应该能稳过。0-5 min:自我介绍 + 项目背景- 顺利。讲清楚了我的 RAG 是给法律咨询场景做的,痛点是大模型不懂行业术语。5-20 min:项目深挖(开始崩)- Q1:你的法律文档总共多少?切了多少个 chunk?- 我:约 500 份 PDF,5 万个 chunk- Q2:500 份 PDF 加起来才 5 万 chunk?平均每份 100 个 chunk,你切片粒度是多少?- 我:512 token- Q3:法律文档里"第三条第二款"和"第三条之二"是不同含义,你的切片会不会把它切散?- 我:(沉默 5 秒)……应该会- Q4:那你怎么解决?- 我:我可以加一个 metadata……(开始编)❌ 第一次崩:切片粒度没考虑业务语义。20-35 min:评测体系(继续崩)- Q:你怎么知道你的 RAG 有效?- 我:我用 Recall@5……- Q:评测集多少条?怎么构造的?- 我:100 条,我手工标注的- Q:100 条够吗?分布怎么样?- 我:分布……我没分- Q:那你的 Recall@5 是 0.81,你怎么知道这个数字是好是坏?baseline 是什么?- 我:(沉默 10 秒)❌ 第二次崩:没有 baseline,没分布分析,纯靠"看起来还行"。35-55 min:Agent 部分(彻底崩)- Q:你的 Agent demo 用了几个工具?- 我:3 个,搜索、计算器、文档查询- Q:当用户问一个问题,你的 Agent 怎么决定调哪个工具?- 我:用 ReAct,让模型自己决定- Q:模型决策错了怎么办?- 我:我加了个 reflection……- Q:reflection 失败 3 次后怎么处理?- 我:(沉默 15 秒)……我没想过❌ 第三次崩:异常路径完全没设计。55-65 min:业务理解 + 反问- Q:你觉得字节做 AI 应用最大的瓶颈是什么?- 我:算力?数据?- Q:你看过哪些字节最近发的 AI 产品?- 我:豆包、扣子……- Q:扣子是 Agent 平台还是工作流平台?- 我:(再次沉默)❌ 第四次崩:对面试公司业务一无所知。
面试官拷打AI项目都会问...
点赞 评论 收藏
分享
发点面经攒攒人品~1.详细介绍一下agent项目的核心功能?2.智能运维助手的"运维"具体如何定义?3.系统有哪几个主要的组成部分?4.Spring ai alibaba覆盖了你上面说的哪些部分?5.Planner/Executor/Supervisor模式的优点是什么?比如说我接收一个请求的处理,它的优点是什么?6.在Planner/Executor/Supervisor模式中,拆分为3个agent和只使用1个agent,最关键的优势和区别是什么?7.介绍RAG的核心流程?8.召回和重排用的什么算法?(没用重排,道歉)9.为什么要做RAG?10.模型回复效果不好的话,如何在RAG层面采取优化措施?如何通过微调采取优化措施?微调属于预训练还是后训练?11.简单对比一下MySQL和Redis各自的特点?12.MySQL的"关系型"是什么意思?13.Redis能不能做存储,而不仅仅是缓存?14.场景题: Java多线程并发模型相关: 比如说我有这么一个场景,总体上是一个生产消费的一个模型,但是这个整个的任务的量比较大。就是比如说我有很多的任务,然后可能有成千上万个生产者消费者。比如说有1万个生产者生产消息,然后有5万个消费者消费消息,或者叫任务或者消息或者数据都可以吧。然后因为整体任务量很大嘛,所以大家要去并发去生产和消费。能简单说一下,这样的话用Java的并发模型和并发控制所相关的这个机制怎么去实现,就口述就可以
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务