26.4.23 淘天天猫技术测开一面
一、基本情况与项目背景
1.请做一个简单自我介绍。
2.你简历里的两段 AI 项目和字节实习经历,整体技术背景是什么?
二、计算机基础
3.顺序存储和链式存储有什么区别?在随机访问、遍历、插入删除上的效率分别如何?
4.HTTPS 的加密原理是什么?对称加密和非对称加密有什么区别?为什么 HTTPS 要结合两者使用?
5.高并发场景下,数据库性能可以从哪些方向优化?比如索引、分库分表、缓存分别适合解决什么问题?
6.Redis 缓存穿透、缓存击穿分别是什么?一般怎么解决?
三、RAG 与检索系统
7.RAG 的完整流程是什么?从文档处理、分块、向量化、索引、检索、重排到生成答案,每一步分别做什么?
8.混合检索一般包含哪些方式?向量检索和关键词检索分别适合什么场景?
9.向量检索在哪些情况下表现不好?比如专业名词、日期、编号、精确字段为什么更适合关键词检索?
10.如果 RAG 检索质量比较低,可能是什么原因?你会从 Query 改写、Embedding 模型、Top-k 召回、重排、关键词匹配等方面怎么优化?
四、大模型生成参数与输出控制
11.如果希望大模型输出更稳定、更确定,可以调整哪些参数?Temperature、Top-k、Top-p 分别有什么作用?
12.除了调参数,提示词层面如何提高输出的准确性、确定性和可追溯性?
五、LangChain / LangGraph 技术选型
13.你的项目为什么选择 LangChain?
14.LangChain 和 LangGraph 的区别是什么?什么场景下 LangGraph 更适合?
六、Multi-Agent 架构设计
15.你的多 Agent 系统是怎么设计的?主控 Agent、子 Agent、分析 Agent 分别负责什么?
16.多 Agent 之间是如何协作的?任务编排、工具调用、状态管理和结果汇总是怎么做的?
17.相比单 Agent,多 Agent 在上下文隔离、职责拆分、问题排查方面有什么优势?又会带来哪些复杂度?
七、金融 Agent 的幻觉控制与冲突处理
18.金融场景对准确性要求高,你做了哪些减少幻觉的设计?比如降低 Temperature、引用来源、无依据不输出等。
19.如果实时新闻和知识库结论冲突,你会如何处理?如何根据用户意图判断该更信实时数据还是长期经验?
20.系统里有行情数据、新闻数据、知识库数据等异构数据,你是如何分别处理的?如果要统一检索,会如何设计 metadata、过滤和重排策略?
八、AI 交互系统与上下文管理
21.你项目里的滑动窗口 / 类滑动窗口上下文管理是怎么做的?超过 token 限制时如何丢弃或保留历史?
22.如果不想直接丢弃历史对话,如何通过摘要机制、长期记忆、短期记忆来优化上下文管理?
23.子进程调用 AI 接口、主进程通过 JSON 通信这一套机制是怎么设计的?为什么不让主进程直接调用?
24.如果子进程调用 AI 接口超时、崩溃或失败,主进程如何感知、重试、记录日志和停止重试?
九、Agent 评估体系与后续优化
25.你的 Agent 系统现在是怎么评估效果的?如果要做完整评估体系,会从人工评测、测试集、系统指标、RAG 指标、用户反馈哪些方面建设?
26.如何评估工具调用成功率、接口超时率、运行成功率、检索召回率和回答质量?
27.你的 Agent 后续有哪些优化方向?比如长短期记忆、用户画像、反馈闭环、动态调整子 Agent 权重等。
28.为什么 Agent 的“自动自进化”比较难,仍然需要人工干预和质量评估?
1.请做一个简单自我介绍。
2.你简历里的两段 AI 项目和字节实习经历,整体技术背景是什么?
二、计算机基础
3.顺序存储和链式存储有什么区别?在随机访问、遍历、插入删除上的效率分别如何?
4.HTTPS 的加密原理是什么?对称加密和非对称加密有什么区别?为什么 HTTPS 要结合两者使用?
5.高并发场景下,数据库性能可以从哪些方向优化?比如索引、分库分表、缓存分别适合解决什么问题?
6.Redis 缓存穿透、缓存击穿分别是什么?一般怎么解决?
三、RAG 与检索系统
7.RAG 的完整流程是什么?从文档处理、分块、向量化、索引、检索、重排到生成答案,每一步分别做什么?
8.混合检索一般包含哪些方式?向量检索和关键词检索分别适合什么场景?
9.向量检索在哪些情况下表现不好?比如专业名词、日期、编号、精确字段为什么更适合关键词检索?
10.如果 RAG 检索质量比较低,可能是什么原因?你会从 Query 改写、Embedding 模型、Top-k 召回、重排、关键词匹配等方面怎么优化?
四、大模型生成参数与输出控制
11.如果希望大模型输出更稳定、更确定,可以调整哪些参数?Temperature、Top-k、Top-p 分别有什么作用?
12.除了调参数,提示词层面如何提高输出的准确性、确定性和可追溯性?
五、LangChain / LangGraph 技术选型
13.你的项目为什么选择 LangChain?
14.LangChain 和 LangGraph 的区别是什么?什么场景下 LangGraph 更适合?
六、Multi-Agent 架构设计
15.你的多 Agent 系统是怎么设计的?主控 Agent、子 Agent、分析 Agent 分别负责什么?
16.多 Agent 之间是如何协作的?任务编排、工具调用、状态管理和结果汇总是怎么做的?
17.相比单 Agent,多 Agent 在上下文隔离、职责拆分、问题排查方面有什么优势?又会带来哪些复杂度?
七、金融 Agent 的幻觉控制与冲突处理
18.金融场景对准确性要求高,你做了哪些减少幻觉的设计?比如降低 Temperature、引用来源、无依据不输出等。
19.如果实时新闻和知识库结论冲突,你会如何处理?如何根据用户意图判断该更信实时数据还是长期经验?
20.系统里有行情数据、新闻数据、知识库数据等异构数据,你是如何分别处理的?如果要统一检索,会如何设计 metadata、过滤和重排策略?
八、AI 交互系统与上下文管理
21.你项目里的滑动窗口 / 类滑动窗口上下文管理是怎么做的?超过 token 限制时如何丢弃或保留历史?
22.如果不想直接丢弃历史对话,如何通过摘要机制、长期记忆、短期记忆来优化上下文管理?
23.子进程调用 AI 接口、主进程通过 JSON 通信这一套机制是怎么设计的?为什么不让主进程直接调用?
24.如果子进程调用 AI 接口超时、崩溃或失败,主进程如何感知、重试、记录日志和停止重试?
九、Agent 评估体系与后续优化
25.你的 Agent 系统现在是怎么评估效果的?如果要做完整评估体系,会从人工评测、测试集、系统指标、RAG 指标、用户反馈哪些方面建设?
26.如何评估工具调用成功率、接口超时率、运行成功率、检索召回率和回答质量?
27.你的 Agent 后续有哪些优化方向?比如长短期记忆、用户画像、反馈闭环、动态调整子 Agent 权重等。
28.为什么 Agent 的“自动自进化”比较难,仍然需要人工干预和质量评估?
全部评论
相关推荐
查看12道真题和解析