百度 AI Agent 开发二面

1、自我介绍

2、我看你做了3个项目, 讲一下你觉得最具代表性的项目

3、项目的Agent怎么设计的

4、Agent 基于什么框架

一般会基于 LangChain 或者 LangGraph 这类框架来实现。如果任务流程比较线性，比如“识别任务 -> 调工具 -> 汇总结果”，LangChain 就够用，因为它比较适合快速搭建工具调用链路和 Prompt 编排。如果任务流程里状态比较多、分支比较复杂，比如失败重试、条件跳转、多轮状态推进、人工确认节点这些，LangGraph 更合适，因为它本质上是图结构编排，更容易描述有状态的 Agent 工作流。

如果是校招项目或者实习项目，比较常见的做法是：底层模型调用、Prompt 模板、输出解析、工具封装用 LangChain，状态控制和复杂分支用自己代码补充；如果项目更完整一点，就会直接用 LangGraph 组织整个流程。

5、LangChain 有哪些常用工具

LangChain 常用的能力主要有 PromptTemplate、LLM、OutputParser、Memory、Retriever、Tool、Agent、Chain 这些。PromptTemplate 用来管理 Prompt 模板；LLM 是模型调用接口；OutputParser 负责把模型输出解析成结构化格式；Memory 用来做对话历史管理；Retriever 用来接知识库检索；Tool 用来封装外部能力，比如搜索、数据库、OCR、接口调用；Agent 负责决定何时调用工具；Chain 用来把多个步骤串起来。

如果是做 RAG，常用的是文本切分、Embedding、向量库检索和 Retriever。如果是做 Agent，常用的是 Tool、AgentExecutor、PromptTemplate、OutputParser 这些组件。

from langchain.tools import tool

@tool
def query_expense_policy(keyword: str) -> str:
    """查询差旅报销制度"""
    if "机票" in keyword:
        return "机票报销需提供行程单和发票"
    if "酒店" in keyword:
        return "酒店报销需提供发票和入住明细"
    return "未查询到相关制度"

print(query_expense_policy.invoke("机票报销"))

6、模型微调经验、微调参数、训练轮次、模型输入输出

如果做过微调，一般是基于现成预训练模型做监督微调，不会从零训练底座模型。微调目标通常有两类，一类是让模型更适配业务场景，比如报销问答、票据理解、知识库问答；另一类是让模型在固定格式输出、工具调用、指令跟随上更稳定。

训练数据一般是指令数据或者问答数据。输入通常是 system prompt、用户问题、上下文信息、工具返回结果这些；输出通常是 assistant 需要生成的目标答案，或者固定 JSON 结构。

训练参数上，常见设置是学习率在 (1e^{-5}) 到 (5e^{-5}) 之间，batch size 结合显存决定，常配合梯度累积，训练轮次一般是 2 到 5 轮。因为指令微调数据通常没有预训练那么大，轮次不会特别高，更多是靠数据质量和任务定义来控制效果。如果是 LoRA 微调，还会有 rank、alpha、dropout 这些参数。比如 rank 常见是 8、16 或 32，dropout 常见是 0.05 左右。

输入输出的本质可以理解成：输入是“问题 + 上下文 + 任务约束”，输出是“目标回答或目标结构”。训练时通常只对 assistant 的回答部分计算 loss，用户输入和系统提示只是条件，不参与监督。

sample = {
    "instruction": "根据用户上传的票据和OCR结果，判断是否可以提交报销",
    "input": {
        "user_query": "帮我看下这次出差材料能不能报销",
        "ocr_text": "机票行程单 金额1200 日期2025-03-01",
        "policy": "机票报销需提供行程单和发票"
    },
    "output": {
        "status": "缺少材料",
        "missing_fields": ["发票"],
        "message": "当前缺少发票，暂时不能提交报销"
    }
}