一、基本情况与项目背景1.请做一个简单自我介绍。2.你简历里的两段 AI 项目和字节实习经历,整体技术背景是什么?二、计算机基础3.顺序存储和链式存储有什么区别?在随机访问、遍历、插入删除上的效率分别如何?4.HTTPS 的加密原理是什么?对称加密和非对称加密有什么区别?为什么 HTTPS 要结合两者使用?5.高并发场景下,数据库性能可以从哪些方向优化?比如索引、分库分表、缓存分别适合解决什么问题?6.Redis 缓存穿透、缓存击穿分别是什么?一般怎么解决?三、RAG 与检索系统7.RAG 的完整流程是什么?从文档处理、分块、向量化、索引、检索、重排到生成答案,每一步分别做什么?8.混合检索一般包含哪些方式?向量检索和关键词检索分别适合什么场景?9.向量检索在哪些情况下表现不好?比如专业名词、日期、编号、精确字段为什么更适合关键词检索?10.如果 RAG 检索质量比较低,可能是什么原因?你会从 Query 改写、Embedding 模型、Top-k 召回、重排、关键词匹配等方面怎么优化?四、大模型生成参数与输出控制11.如果希望大模型输出更稳定、更确定,可以调整哪些参数?Temperature、Top-k、Top-p 分别有什么作用?12.除了调参数,提示词层面如何提高输出的准确性、确定性和可追溯性?五、LangChain / LangGraph 技术选型13.你的项目为什么选择 LangChain?14.LangChain 和 LangGraph 的区别是什么?什么场景下 LangGraph 更适合?六、Multi-Agent 架构设计15.你的多 Agent 系统是怎么设计的?主控 Agent、子 Agent、分析 Agent 分别负责什么?16.多 Agent 之间是如何协作的?任务编排、工具调用、状态管理和结果汇总是怎么做的?17.相比单 Agent,多 Agent 在上下文隔离、职责拆分、问题排查方面有什么优势?又会带来哪些复杂度?七、金融 Agent 的幻觉控制与冲突处理18.金融场景对准确性要求高,你做了哪些减少幻觉的设计?比如降低 Temperature、引用来源、无依据不输出等。19.如果实时新闻和知识库结论冲突,你会如何处理?如何根据用户意图判断该更信实时数据还是长期经验?20.系统里有行情数据、新闻数据、知识库数据等异构数据,你是如何分别处理的?如果要统一检索,会如何设计 metadata、过滤和重排策略?八、AI 交互系统与上下文管理21.你项目里的滑动窗口 / 类滑动窗口上下文管理是怎么做的?超过 token 限制时如何丢弃或保留历史?22.如果不想直接丢弃历史对话,如何通过摘要机制、长期记忆、短期记忆来优化上下文管理?23.子进程调用 AI 接口、主进程通过 JSON 通信这一套机制是怎么设计的?为什么不让主进程直接调用?24.如果子进程调用 AI 接口超时、崩溃或失败,主进程如何感知、重试、记录日志和停止重试?九、Agent 评估体系与后续优化25.你的 Agent 系统现在是怎么评估效果的?如果要做完整评估体系,会从人工评测、测试集、系统指标、RAG 指标、用户反馈哪些方面建设?26.如何评估工具调用成功率、接口超时率、运行成功率、检索召回率和回答质量?27.你的 Agent 后续有哪些优化方向?比如长短期记忆、用户画像、反馈闭环、动态调整子 Agent 权重等。28.为什么 Agent 的“自动自进化”比较难,仍然需要人工干预和质量评估?