今天 19:55 广西大学算法工程师发布于天津

关注

阿里国际 AI应用开发实习一面

1. 自我介绍

2. RAG 的检索索引怎么设计？

答案：RAG 的检索索引不能只建一个向量字段就结束。实际系统里，我会把索引分成语义索引、关键词索引、结构化索引和权限索引。语义索引用来处理自然语言问题，关键词索引用来处理规则编号、商品编码、报关术语、单据字段名这类精确匹配，结构化索引用来按国家、业务类型、规则版本、生效时间过滤，权限索引用来保证用户只能查自己有权限的数据。

文档入库时也要保留足够元数据，比如 doc_id、chunk_id、parent_id、section_path、doc_type、country、effective_date、version、tenant_id。如果没有这些字段，后面很难做版本控制、权限隔离和证据回溯。RAG 的索引设计，本质上是为召回、过滤、重排和引用服务的。

chunk_doc = {
    "doc_id": "customs_rule_2026_001",
    "chunk_id": "customs_rule_2026_001_c12",
    "parent_id": "customs_rule_2026_001_sec3",
    "section_path": ["出口申报规则", "商品归类", "申报要素"],
    "doc_type": "policy",
    "country": "US",
    "version": "v2026.04",
    "effective_date": "2026-04-01",
    "tenant_id": "tenant_001",
    "content": "申报商品为电子元器件时，应填写品牌、型号、用途、材质等要素。",
    "embedding": [0.01, 0.03]
}

3. 怎么把一个普通工具变成 MCP Server？

答案：把普通工具变成 MCP Server，本质是把本地函数、数据库查询、HTTP 服务或者业务能力封装成标准化工具接口。关键不是简单暴露一个函数，而是要定义工具名、描述、输入 schema、输出 schema、错误格式、权限要求和超时策略。Agent 通过 MCP Client 发现工具，再根据工具描述和参数 schema 生成调用。

比如把“查询商品申报规则”变成 MCP 工具，需要定义输入参数：商品编码、目的国、业务类型；输出参数：规则列表、版本、生效时间、引用来源。工具内部仍然可以查数据库或搜索引擎，但对 Agent 来说，它看到的是一个稳定的协议化能力。

from mcp.server.fastmcp import FastMCP
from pydantic import BaseModel

mcp = FastMCP("customs-compliance-server")

class RuleQuery(BaseModel):
    hs_code: str
    country: str
    biz_type: str

@mcp.tool()
def query_declaration_rule(hs_code: str, country: str, biz_type: str) -> dict:
    """
    查询指定商品编码在目标国家下的申报规则。
    """
    # 实际项目中这里会查询数据库或检索服务
    return {
        "hs_code": hs_code,
        "country": country,
        "biz_type": biz_type,
        "rules": [
            {
                "rule_id": "R-2026-041",
                "content": "需填写品牌、型号、用途、材质、是否带电。",
                "version": "v2026.04"
            }
        ]
    }

if __name__ == "__main__":
    mcp.run()

4. LangGraph 的状态流转怎么设计？状态一般是什么类型？

答案：LangGraph 里状态通常会设计成一个结构化对象，可以用 TypedDict、Pydantic BaseModel 或普通 dict。状态里不应该只存消息列表，而应该存任务目标、当前步骤、用户输入、检索结果、工具调用结果、中间判断、错误信息和最终输出。这样图里的每个节点都可以读写状态，实现可恢复的流程编排。

比如审单场景中，状态可以包括：用户问题、单据字段、风险候选、检索证据、工具调用记录、重试次数和最终审查意见。节点之间通过状态传递，不是靠自然语言上下文猜测。这样比普通 chain 更适合复杂任务，因为它可以根据状态条件分支、循环、重试和中断。

from typing import TypedDict, List, Dict, Any
from langgraph.graph import StateGraph, END

class ReviewState(TypedDict):
    query: str
    document_fields: Dict[str, Any]
    evidence: List[dict]
    risk_items: List[dict]
    retry_count: int
    final_answer: str

def parse_document(state: ReviewState):
    state["document_fields"] = {
        "hs_code": "854239",
        "country": "US",
        "description": "integrated circuit module"
    }
    return state

def retrieve_rules(state: ReviewState):
    state["evidence"] = [
        {"rule_id": "R001", "content": "集成电路模块需补充品牌、型号和用途。"}
    ]
    return state

def generate_answer(state: ReviewState):
    state["final_answer"] = "该单据存在申报要素不完整风险，需补充品牌、型号和用途。"
    return state

graph = StateGraph(ReviewState)
graph.add_node("parse_document", parse_document)
graph.add_node("retrieve_rules", retrieve_rules)
graph.add_node("generate_answer", generate_answer)

graph.set_entry_point("parse_document")
graph.add_edge("parse_document", "retrieve_rules")
graph.add_edge("retrieve_rules", "generate_answer")
graph.add_edge("generate_answer", END)

app = graph.compile()

5. SSE 和 WebSocket 的区别是什么？大模型流式输出选哪个？

答案：SSE 是服务端单向推送，基于 HTTP，客户端建立连接后，服务端可以不断推送事件。它实现简单、兼容性好、适合大模型流式输出、日志推送、任务进度通知这类服务端到客户端的单向数据流。WebSocket 是全双工通信，客户端和服务端都可以主动发送消息，适合在线协作、实时聊天、多人编辑、实时控制这类高频双向交互。

如果只是大模型逐 token 输出，SSE 通常更简单稳定。因为用户发起一次请求后，服务端持续返回 token，不需要复杂的双向协议。如果是 Agent 运行过程中用户随时打断、动态补充参数、实时控制工具执行，WebSocket 会更灵活。

from fastapi import FastAPI
from fastapi.responses import StreamingResponse
import time

app = FastAPI()

def token_stream():
    tokens = ["正在", "检索", "规则", "并", "生成", "答案"]
    for t in tokens:
        yield f"data: {t}\n\n"
        time.sleep(0.3)

@app.get("/stream")
def stream():
    return StreamingResponse(token_stream(), media_type="text/event-stream")

6. 你知道哪些向量化模型？不同 embedding 模型怎么选？

答案：常见向量化模型可以分成通用语义模型、双语/多语模型、代码 embedding 模型和领域 embedding 模型。中文和中英混合场景常见的是 BGE 系列、text2vec、m3e、gte、Qwen embedding 等；英文或多语场景可以考虑 E5、GTE、BGE-M3；代码检索可以考虑 code embedding 模型；如果是电商、物流、医疗、金融这种强领域场景，还可以用领域数据做对比学习微调。

选型时不能只看公开榜单，要看自己的评测集。重点看 Recall@K、MRR、nDCG、跨语言召回、长文本截断、实体精确匹配、推理延迟和向量维度。比如跨境供应链里有中文问题、英文规则、商品编码和行业缩写，普通中文 embedding 可能不够，需要中英跨语义能力更强的模型。

embedding_candidates = {
    "bge-m3": ["multi-lingual", "dense+sparse", "long_context"],
    "bge-large-zh": ["chinese", "semantic_retrieval"],
    "gte-large": ["general_embedding", "english_chinese"],
    "text2vec": ["lightweight", "chinese"],
    "code-embedding": ["code_search", "api_search"]
}

7. 好的 Prompt 工程应该包含哪些内容？

答案：好的 Prompt 不只是把问题写清楚，而是要包含角色、任务目标、输入信息、输出格式、约束条件、可用工具、失败策略和示例。尤其在 RAG 和 Agent 场景里，Prompt 还要明确“只能基于证据回答”“证据不足时要说明不足”“不能伪造引用”“工具结果优先于模型记忆”。

对于结构化任务，最好要求模型输出 JSON，并给出 schema。对于高风险任务，要加入边界条件，比如不能生成法律最终结论，只能生成辅助审查建议。Prompt 工程的目标不是让模型更会说，而是让模型在可控边界内稳定完成任务。

prompt = """
你是跨境供应链合规审查助手。

任务：
根据用户问题、单据字段和检索证据，判断是否存在申报风险。

约束：
1. 只能基于【证据】回答；
2. 如果证据不足，输出“证据不足，无法判断”；
3. 不得编造规则编号；
4. 输出必须是 JSON。

输出格式：
{
  "has_risk": true/false,
  "risk_items": [
    {"field": "...", "reason": "...", "evidence_id": "..."}
  ],
  "suggestion": "..."
}
"""

8. RAG 的重排序有哪些方法？

答案：RAG 重排序常见方法有四类。第一类是基于规则的重排序，比如按文档版本、生效时间、权限、标题层级、字段匹配度加权。第二类是 Cross-Encoder rerank，把 query 和候选 chunk 拼接后打相关性分数，效果通常比纯向量更准。第三类是 LLM rerank，让大模型判断哪些证据最能回答问题，适合复杂多跳问题，但成本高、延迟大。第四类是学习排序，比如 LambdaMART 或基于点击/标注数据训练排序模型。

线上一般不会只用一种方法。常见做法是先用向量和关键词召回 Top100，再用 Cross-Encoder 排到 Top20，最后结合规则过滤和 MMR 去重选 Top5。这样可以兼顾速度、准确率和上下文多样性。

def rule_rerank(candidates):
    for c in candidates:
        score = c["semantic_score"]

        if c.get("is_latest_version"):

剩余60%内容，订阅专栏后可继续查看/也可单篇购买

AI-Agent面试实战专栏文章被收录于专栏

本专栏聚焦 AI-Agent 面试高频考点，内容来自真实面试与项目实践。系统覆盖大模型基础、Prompt工程、RAG、Agent架构、工具调用、多Agent协作、记忆机制、评测、安全与部署优化等核心模块。以“原理+场景+实战”为主线，提供高频题解析、标准答题思路与工程落地方法，帮助你高效查漏补缺.

全部评论

推荐最新楼层

05-08 09:54

清华大学数字IC前端设计

小米top2简历全挂（但我同学已oc）

不知道怎么取名字_：青花的都挂啊，这是要啥人呢

点赞评论收藏

05-05 11:05

字节跳动_后端开发(实习员工)

学院本拿下字节暑期offer!!!

兄弟们，七面终上岸！😭😭一路走来满是坎坷与波折，从最初的遥不可及、不敢奢望，到如今咬牙坚持终得圆满。付出了无数努力，熬过无数难熬的时刻，也算给前段时间的埋头拼搏画上圆满句号。点赞多的话，后续整理完整面经，分享经验干货，帮大家少走弯路～

喜欢飞来飞去的斜杠青...：国内大厂要七面？？Google也才3轮。。

字节开奖

点赞评论收藏

05-09 20:50

东南大学

 可以捡漏吗五月底暑期实习

这就开摆的斜杠青年很...：看学校有没有吧，我们学校五月底有实习双选会

牛客在线求职答疑中心

点赞评论收藏

昨天 23:31

华东理工大学 Java

暑期就这样草率结束了

3月下旬开始投简历，主投的是java开发，其次是agent，基本上能投的都投了，笔试挂了一堆，最后只有3家约到了面试，本来打算面试过不了就不去暑期了，行测开始启动，直接一步到位，最终还是感谢多多的收留2026.4.8pdd一面1、自我介绍2、问第一段实习，这个系统完不完善，你主要做了什么，挑个映像深的讲述一下3、问第二段实习，公司人员规模，主要做了什么，redis和数据库缓存一致性4、b+树，临建锁主要解决什么问题,select c from table where a=1 and b=2,ab索引快还慢5、滑动窗口最大值，有序数组找到出现一半以上的数字6、反问，主要做中间件，AI不好说，项目理解，多刷题7、总共45分钟左右2026.4.13pdd二面1、自我介绍2、为何选择学习做spring这一套3、讲一下最近一段实习的内容4、页面响应时间优化减少这个问题你是怎么发现的，如何解决的5、IOC、AOP、依赖注入6、spring是如何解决bean的冲突（忘了，直接回答成spring三级缓存了）7、MVCC8、删除倒数第K个链表节点，有序数组构建平衡二叉树，二叉树最大深度，搜索二叉树转有序双向链表，最后一题没来得及做9、反问让给学习建议，技术基础知识掌握好，有实习经历更好，AI写代码已经有人再用10、问答20分钟，做题40分钟面试官全程只问我答，没有进一步深问。2026.4.16pdd三面1、面试官自我介绍，基础平台团队，比如资源调度，分布式存储，中间件2、先自我介绍，介绍项目，写题，公司部门介绍等3、自我介绍4、JWT原理，怎么用在你这个项目中；对称加密非对称加密是怎么用在这的，这个是用在https中的，JWT本身是不加密的；如何续期；两个token区别；两把钥匙对安全性有何提高；两把钥匙在客户端存储方式是一样的吗5、redis底层机制，比如持久化；rdb是如何做到内存快照dump到磁盘中；因为redis数据一直在变化，是如何保证正确的数据dump进去的,引导可以加锁，但redis不是这样做的；后面我提了乐观锁，不是这样；bgsave fork子进程；子进程为何能做到呢；子进程父进程看到的内存是一样的吗；操作系统是如何做到的；子进程fork完，父进程进行了修改，子进程看不到，操作系统是如何做到的6、最近一份实习做的东西，讲久一些7、账单如何来的；导入的时候幂等性；8、实习带来最大的收获9、算法：数据流等概率获取一个数（蓄水池抽样），没做出来10、反问让给学习建议，多练习算法题11、问答30分钟，做题30分钟2026.4.22pdd四面hr面1、推免or考研，为何选择来现在的硕士学校2、本科城市和目前城市生活体感，工作啥的有何不同感受3、两段实习是学校的项目还是自己找的4、实习和读书有啥差别，有无成就感，实习对你今后的择业有何认知5、工作城市意向6、父母以及家庭成员工作，自己的择业会会不会听父母的7、有无对象，有无其他offer8、投递工作偏向哪些类型公司9、最早实习时间以及时长10、若实习转正，你就不去看看其他公司的机会吗11、对拼多多的了解，整体印象，你想在实习中获得什么，包括0-3年规划12、耐心等待综合评估13、总共20分钟2026.4.23 电话问信息（当时网上填的信息和hr面试问的信息回答得有出入）2026.4.30 信息邮件确认2026.5.6 offer2026.4.9 字节一面1、本硕不是学计算机的2、介绍最近一段实习的内容，中途被打断，说考察技术问题3、SQL语句，user表order表，获取2025年消费额前三的用户4、输入网址到服务端处理后响应到前端过程5、DNS的cname,aname6、请求是如何被springboot捕获并映射到对应的controller中7、并发应用你会根据什么因素选择什么样的线程池；了解哪些线程池8、MQ是怎么用的，自己写sdk还是干嘛9、RPC框架组成，请求响应过程（不知道）10、算法题，下一个更大的整数11、让给学习建议，知识停留在用的方面，不知道原理，只背过八股12、问答20分钟，写题30分钟2026.4.10 阿里淘宝闪购1、自我介绍2、实习中比较复杂的需求的原因、背景、技术栈。3、mysql同步到odps如何保证及时、准确、一致性，发现同步误差问题如何补救4、聚簇索引、覆盖索引5、SQL执行过程底层原理，客户端-服务端-DB6、慢SQL优化7、千万数据查询limit 100000,10,要2种方案8、explain分析字段介绍，强制走某个索引怎么做9、B+树性能提升原因10、主从一致性如何保证的11、项目中用redis的场景原因，不用会怎么样，缓存挂了解决；数据库缓存一致性；12、LLM、LM，底层依赖是什么（神经网络）13、神经网络什么作用，为何能用在LLM中14、token,是一个字母还是一个单词15、用过什么ai工具，prompt和skill区别16、系统切换数据库用AI辅助的实操细节17、开发一个MCP你会怎么做18、没反问老师，老师让多准备准备19、整体面试40分钟面试馆人特别好，没回答好的都会补充。2026.4.10阿里飞猪1、自我介绍2、实习的难点和挑战3、计费系统计费的流程，详细问了一下业务流转细节4、上一家实习离职原因5、对ai了解程度，有自己写过skill没，skill的关键点是什么6、30万条数据让AI分析，考察AI怎么读表（说提示Ai写脚本）7、你觉得大模型最擅长什么，比如文字推理，数据分析；对于它不擅长的怎么办8、RAG，文档向量化后是什么？什么是向量；9、agent，和workflow的关系，这2个什么场景下会用10、spring AI 和langchain11、static和final关键字的区别，分别能修饰什么12、多线程环境如何安全处理用户的会话历史，提了threadLocal问还有什么，提示放到缓存13、hashmap底层原理，红黑树；红黑树和平衡二叉树哪个查询效率高14、大模型幻觉你如何解决15、functional calling 和mcp区别16、最近学习什么新的技术，如何学习的，去哪里学习17、30分钟问题，30分钟AICoding，让实现一个热更新系统

发面经攒人品

点赞评论收藏

05-09 12:08

西安邮电大学 golang

现在的实习生都是不学就进来实习的吗？

不止遇到一次了，什么都不会，让提合并请求，问什么是合并请求。让gitlab.页面把测试截图附上，不知道截图要放在哪，那么大的编辑看不到吗让配开发机，问ip是什么东西……这都咋进来的啊，我们（我2023年毕业）那会儿没AI的时候面试都是直接linux，docker，k8s，git，结构与算法，计网。怎么才过去2年，实习生跟傻子一样，有些问题问的我难受，不会git commit，不会git pull，不会切换分支，直接要覆盖master....

27届许愿offer：这难道不是应该问一下是咋面进去的吗，那么多候选人偏偏挑了不合适的😂

点赞评论收藏

全站热榜

创作者周榜

正在热议

# AI让海力士市值突破9000亿美元 #

阿里国际 AI应用开发 实习一面

1. 自我介绍

2. RAG 的检索索引怎么设计？

3. 怎么把一个普通工具变成 MCP Server？

4. LangGraph 的状态流转怎么设计？状态一般是什么类型？

5. SSE 和 WebSocket 的区别是什么？大模型流式输出选哪个？

6. 你知道哪些向量化模型？不同 embedding 模型怎么选？

7. 好的 Prompt 工程应该包含哪些内容？

8. RAG 的重排序有哪些方法？

全站热榜

创作者周榜

阿里国际 AI应用开发实习一面