【面经】阿里淘宝闪购 · Agent 算法工程师 · 27届实习一面时长约 60 分钟

自我介绍后直接进入项目深挖，无技术笔试，全程围绕 Agent 工程经验展开。

Q1：你为何选用 OpenAI Agents SDK 而非开源框架？出于安全合规考量，开源方案是否更合适？

核心考点是框架选型的 trade-off 认知。我说明了 SDK 在 tool 编排稳定性和工程成熟度上的优势，同时承认在企业生产环境中确实应优先评估开源/私有化部署方案，以满足数据不出域要求。面试官对"我知道它的局限"这个态度比较认可。

Q2：你遇到过需要人工强制中断 Agent 执行的情况吗？如何处理 Human-in-the-Loop？

介绍了关键 tool 执行前插入确认节点、置信度低于阈值时暂停并通知人工审核的方案。面试官追问是否在 .md 文件里写了强制停止条件——我说有在 instruction file 中定义 STOP_CONDITION，Agent 每轮 plan 阶段会读取校验。

Q3：在高风险在线环境中，Agent 异常管控方案是什么？

我从四个维度回答：① tool 操作分级（只读/可逆写入/不可逆三类）；② 熔断机制（连续 N 次失败自动终止）；③ 沙箱与生产隔离；④ 结构化审计日志。

Q4：token 用量规模？长周期对话（间隔数周后继续）如何管理历史？

需要回答每天token用量，我是1M。重点介绍了分层压缩策略：近期原文保留→历史按时间粒度摘要压缩→关键事件结构化存入向量数据库，新会话通过检索相关片段注入 system prompt 完成冷启动。

Q5：对比 OpenClaw（龙虾）和 Hermes 的记忆机制，重点说说 OpenClaw 的分层压缩方案和 .md 文件使用方式。

OpenClaw 以时间轴为轴分层：T-1h 完整保留、T-24h 段落摘要、T-7d 关键词图，结合语义相似度分层召回。Hermes 侧重 episodic memory，双索引但长历史压缩粒度不如前者。我的方案是融合两者，.md 用于 human-in-loop 审查，向量库用于语义检索。

Q6：你的 Agent 还有哪些未充分优化的空间？

当前最大短板是缺闭环反馈。补充的方向：基于 task 完成率的 DPO/PPO 微调 planner；量化 alpha 上线前的历史回测+仿真双验证；多版本 Agent 沙盒 ELO 竞争选优；以及元认知层的自我评分机制。

Q7：除调用 API，你有 SFT 或模型层工作经验吗？

有。基于 BERT（0.1B）做了金融新闻双任务微调（重要性回归 + 情感分类），发布在 HuggingFace Hub，40+ 下载量。这段经历让我在 Agent 的 retrieval 和 re-ranking 模块设计中有直接应用。

Q8：你的 Agent 和别人开发的相比，核心差异是什么？

我说大家模型和框架可能趋同，差距体现在：① 严格的 function schema 校验减少格式错误；② CLI 封装原子化操作，token 消耗降低约 30%；③ 针对业务裁剪 tool 集合，平均 tool call 轮次从 8 降至 4，相比依赖 MCP 通用协议的方案更轻。

Q9（Web3 经历）：你在区块链方向做了哪些工作？

① 微信群聊舆情→AI 决策→自动交易全链路；② 基于链上交易图的异质 GNN 团伙操纵识别算法。

反问（面试官回答很真诚）：

淘宝闪购 Agent 主要做时空预测（ETA）、内部知识库、人员效能提升和 AI Coding 探索
与外部智能客服的本质区别：服务内部算法团队，核心是算法研发提效和最优化自动化（Auto Research）
技术方向：大模型+运筹+深度学习+强化学习融合，无单一主轴

AI Coding 压轴题：本地 AUC 训练 92%、测试 89%，上线后跌至 62%，从数据/标签/serving 三维给出 8+ 原因并排序

面试官会给你邮箱发邮件，然后用阿里qwen3.5模型回答给出的问题，面试官会追问答案原因，从自身经验回答。

按优先级排序：① Train-Serving 特征分布偏移（最高频根因）→ ② 线上样本分布与训练集不一致 → ③ 特征泄露导致离线 AUC 虚高 → ④ 标签定义口径不一致 → ⑤ Label Delay 问题 → ⑥ 标注噪声线上放大 → ⑦ 模型版本与 feature schema 未对齐 → ⑧ 在线推理精度损失/缺失填充策略不一致

排序依据：数据层 skew 对 AUC 影响幅度最大（可达 10-30%），工业界出现频率最高，因此排在前三；标签问题通常灰度期可被发现；serving 层问题通过日志比对可快速定位，实际频率相对低。

备考提醒： 面试官会持续追问"为什么这么做"，准备好每个技术选型的 trade-off 表述比准备"最优答案"更重要。

#阿里##实习面经##AI求职记录##我的求职进度条##发面经攒人品#