26.4.23 淘天天猫技术测开一面

一、基本情况与项目背景
1.请做一个简单自我介绍。
2.你简历里的两段 AI 项目和字节实习经历，整体技术背景是什么？

二、计算机基础
3.顺序存储和链式存储有什么区别？在随机访问、遍历、插入删除上的效率分别如何？
4.HTTPS 的加密原理是什么？对称加密和非对称加密有什么区别？为什么 HTTPS 要结合两者使用？
5.高并发场景下，数据库性能可以从哪些方向优化？比如索引、分库分表、缓存分别适合解决什么问题？
6.Redis 缓存穿透、缓存击穿分别是什么？一般怎么解决？

三、RAG 与检索系统
7.RAG 的完整流程是什么？从文档处理、分块、向量化、索引、检索、重排到生成答案，每一步分别做什么？
8.混合检索一般包含哪些方式？向量检索和关键词检索分别适合什么场景？
9.向量检索在哪些情况下表现不好？比如专业名词、日期、编号、精确字段为什么更适合关键词检索？
10.如果 RAG 检索质量比较低，可能是什么原因？你会从 Query 改写、Embedding 模型、Top-k 召回、重排、关键词匹配等方面怎么优化？

四、大模型生成参数与输出控制
11.如果希望大模型输出更稳定、更确定，可以调整哪些参数？Temperature、Top-k、Top-p 分别有什么作用？
12.除了调参数，提示词层面如何提高输出的准确性、确定性和可追溯性？

五、LangChain / LangGraph 技术选型
13.你的项目为什么选择 LangChain？
14.LangChain 和 LangGraph 的区别是什么？什么场景下 LangGraph 更适合？

六、Multi-Agent 架构设计
15.你的多 Agent 系统是怎么设计的？主控 Agent、子 Agent、分析 Agent 分别负责什么？
16.多 Agent 之间是如何协作的？任务编排、工具调用、状态管理和结果汇总是怎么做的？
17.相比单 Agent，多 Agent 在上下文隔离、职责拆分、问题排查方面有什么优势？又会带来哪些复杂度？

七、金融 Agent 的幻觉控制与冲突处理
18.金融场景对准确性要求高，你做了哪些减少幻觉的设计？比如降低 Temperature、引用来源、无依据不输出等。
19.如果实时新闻和知识库结论冲突，你会如何处理？如何根据用户意图判断该更信实时数据还是长期经验？
20.系统里有行情数据、新闻数据、知识库数据等异构数据，你是如何分别处理的？如果要统一检索，会如何设计 metadata、过滤和重排策略？

八、AI 交互系统与上下文管理
21.你项目里的滑动窗口 / 类滑动窗口上下文管理是怎么做的？超过 token 限制时如何丢弃或保留历史？
22.如果不想直接丢弃历史对话，如何通过摘要机制、长期记忆、短期记忆来优化上下文管理？
23.子进程调用 AI 接口、主进程通过 JSON 通信这一套机制是怎么设计的？为什么不让主进程直接调用？
24.如果子进程调用 AI 接口超时、崩溃或失败，主进程如何感知、重试、记录日志和停止重试？

九、Agent 评估体系与后续优化
25.你的 Agent 系统现在是怎么评估效果的？如果要做完整评估体系，会从人工评测、测试集、系统指标、RAG 指标、用户反馈哪些方面建设？
26.如何评估工具调用成功率、接口超时率、运行成功率、检索召回率和回答质量？
27.你的 Agent 后续有哪些优化方向？比如长短期记忆、用户画像、反馈闭环、动态调整子 Agent 权重等。
28.为什么 Agent 的“自动自进化”比较难，仍然需要人工干预和质量评估？

26.4.23 淘天天猫技术测开一面

全站热榜

创作者周榜