03-12 10:48 吉林农业大学算法工程师发布于河北

关注

带得科技大模型应用开发二面

1. 你们线上大模型应用的整体架构是怎样的？

常见架构就是这几层：

用户请求先进入 API 网关，再到业务服务层。业务服务层负责鉴权、限流、Prompt 拼装、会话管理、工具编排。如果有知识库，就先走检索链路；如果要调外部能力，就走工具调用；最后把上下文交给大模型生成结果。生成结果出来后，再做内容过滤、格式化、日志落库、监控上报。

核心链路一般是：

用户请求 -> 业务编排 -> 检索/工具 -> 模型推理 -> 后处理 -> 返回结果

2. 你们怎么做 Prompt 工程？

Prompt 不是简单写一句提示词，而是模板化管理。

常见做法是把 Prompt 拆成几部分：

system prompt
业务指令
上下文
few-shot 示例
输出格式约束
安全约束

线上一般不会把 Prompt 写死在代码里，而是做成配置化。这样方便灰度、A/B 测试、版本回滚。

Prompt 优化最常见的方向有三个：

角色设定清晰
输出格式明确
给足边界条件，减少自由发挥

3. 怎么减少大模型幻觉？

减少幻觉常见就这几种办法：

给模型真实上下文，不要裸问
明确告诉它不知道就说不知道
限制回答范围，只允许基于提供内容回答
给标准输出格式
对结果做引用和校验
高风险场景加规则兜底或人工审核

如果是知识问答场景，最常见就是：

检索增强 + 回答约束 + 结果校验

幻觉不能只靠模型自觉，必须靠上下文、Prompt 和校验一起压。

4. temperature、top_p 这些参数分别是干什么的？

temperature 控制随机性。越低，输出越稳定；越高，输出越发散。

top_p 是核采样。模型不是从所有词里采样，而是只从累计概率达到某个阈值的一小部分词里采样。top_p 越小，输出越保守。

常见经验：

问答、摘要、结构化提取：temperature 低一些
文案、创作、发散生成：temperature 高一些

一般线上不会同时把 temperature 和 top_p 调得太激进，不然结果容易飘。

5. Function Calling / Tool Calling 是怎么做的？

核心就是让模型别直接回答，而是先判断要不要调用工具。

常见流程：

模型先根据用户问题和工具描述决定是否调用工具。如果要调，就输出工具名和参数。业务层接到这个结构化结果后，真正执行工具。拿到工具结果后，再把结果回传给模型，让模型生成最终答案。

关键点有两个：

工具描述要清楚
参数校验要做严，不能直接信模型

一个简单例子：

tool_call = {
    "name": "get_weather",
    "arguments": {
        "city": "北京"
    }
}

6. 你们怎么做会话记忆？

会话记忆通常分两种：

短期记忆和长期记忆。

短期记忆就是当前几轮对话上下文，直接放在 prompt 里。长期记忆一般是把用户偏好、历史事实、重要事件提取出来，单独存储，必要时再召回。

线上不会无限拼接全部历史消息，因为：

token 成本高
长上下文噪声大
很多历史内容根本没用

所以常见做法是：

保留最近 N 轮
对老对话做摘要
关键信息单独结构化存储

7. 流式输出是怎么实现的？

流式输出本质上就是模型边生成，服务边返回。不是等整段话生成完再一次性返回。

常见实现方式：

模型服务端按 token 或 chunk 推送
业务层用 SSE 或 WebSocket 转发给前端
前端一边接收一边渲染

这样做的好处：

首字返回更快
用户体感更好
长回答不容易让用户觉得卡死

如果是 Python 服务里，常见就是生成器逐段返回。

def stream_answer():
    chunks = ["你好，", "这里是", "流式输出结果。"]
    for c in chunks:
        yield c

8. 怎么控制大模

剩余60%内容，订阅专栏后可继续查看/也可单篇购买

AI-Agent面试实战专栏文章被收录于专栏

本专栏聚焦 AI-Agent 面试高频考点，内容来自真实面试与项目实践。系统覆盖大模型基础、Prompt工程、RAG、Agent架构、工具调用、多Agent协作、记忆机制、评测、安全与部署优化等核心模块。以“原理+场景+实战”为主线，提供高频题解析、标准答题思路与工程落地方法，帮助你高效查漏补缺.

全部评论

推荐最新楼层

哞客374226558号

数字马力（长沙）信息技术有限公司_后端开发

祝二面顺利

点赞回复分享

发布于 03-16 21:11 陕西

哈哈哈，你是老六

门头沟学院大数据开发工程师

我看了你很多总结，感觉都很好

点赞回复分享

发布于 03-15 19:22 北京

03-11 20:19

已编辑

门头沟学院 Java

腾讯后台开发一面

太压力了，面了2个多小时，本菜比已经被拷打的瑟瑟发抖面完两个小时后通知过了1.算法题三道（1）leetcode124 二叉树中最大路径和hard题 因为不久前才刷过撕出来了，又来了一道（2）leetcode 300 最长递增子序列变种除了递增之外还加了一个权重因素，但是思路没变，dp就行（3）寻找词汇库里符合固定长度前缀的匹配单词应该是他们自己题库的题。给了一串单词列表，然后又给了一个单词，一个下标，根据这个下标的前缀去单词列表里面找到所有匹配的单词再返回思路是创建一个单词前缀树，然后根据树找，但是可能是构件树数有问题没撕出来2.全方位项目拷打基本没有问八股，全部都是项目企业场景题，哎哟我操，完全不会。我就纯八股战士，结果没想到一道八股都没问反正尽可能把企业场景往八股上引吧。。1. 微服务多点部署其中一个宕机了怎么办2. 要是mq占据大量CPU该怎么排查？MySQL占据大量CPU该怎么排查？3. 假如说让你实现视频点赞功能，你打算怎么设计？讲讲思路（我知道多级缓存，但是碰巧没背……寄）4. Redis延迟双删是什么，分布式锁，哨兵模式5. MySQL到es同步的延迟该怎么优化6. Rabbit mq的队列是怎么实现的？（这个完全没整明白，可能是队列的底层结构? 反正我硬扯的讲了一下rabbit mq的架构）还扯了很多，但是往后完全就慌了），记住的是这些

不知道怎么取名字_：2小时确实有压力，持续性的脑力劳动啊

查看9道真题和解析

点赞评论收藏

03-12 10:44

吉林农业大学算法工程师

带得科技大模型应用开发一面

1. 文章分类大概有多少文章？文章量一般从三个口径说：训练集、验证集、线上累计处理量。实际项目里常见是几万到几十万篇，线上累计处理量会更大。真正影响效果的不只是数量，还有类别是否均衡、长短文本分布是否正常。2. 怎么做的这个分类？怎么实现的呀？就是文本分类标准流程：先做文本清洗，再做标签体系，再做编码表示，最后接分类模型输出结果。如果用的是 BERT，就是文本经过 tokenizer 编码，输入 BERT，取 [CLS] 或池化向量，接线性层做分类。单标签分类一般用 softmax，多标签分类一般用 sigmoid。 from transformers import BertTokenizer...

查看14道真题和解析

点赞评论收藏

03-10 18:55

门头沟学院推荐算法

大模型应用开发二面 1h 字节

面试很难，还是要多多练习，感觉自己说不明白业务逻辑1.写一下attention公式(代码实现了下)2.训练时为什么要mask，推理时也需要吗?两处有什么区别?推理时的sequencelength和训练时一样吗3.transformer和传统seg2seg模型有什么区别?4.计算attention时为什么要除以dk，这个dk的含义是?attention计算时还有哪些scale处理?5.attention中softmax函数作用、公式、为什么有减去最值的处理?换个函数还能这样处理吗?6.解释数值上溢、下溢问题7.讲一下prompt书写的经验，如何判断prompt是否达标何改进prompt8.讲一下SFT，会对哪部分计算loss?为什么?9.讲一下deepspeed10.训练用一个7b模型要占用多少显存?不同zero阶段能够节多少显存?11.训练模型时用了几张卡，有遇到什么异常中断问题吗?

点赞评论收藏

03-12 10:26

吉林农业大学算法工程师

满帮集团大模型应用开发一面

1. xgboost 为什么叫梯度提升树因为它本质上就是：树：基学习器是 CART 回归树提升：一棵一棵往上加梯度：每一轮拟合的是损失函数对当前预测的负梯度普通提升树可以理解成拟合残差，XGBoost 是把“残差”推广成了更一般的梯度下降框架，而且用了二阶导信息，所以比传统 GBDT 更强。2. 知道什么概率模型？朴素贝叶斯，说一下贝叶斯的思想概率模型就是用概率分布描述数据和变量关系的模型，比如：朴素贝叶斯HMMCRFGMM贝叶斯网络贝叶斯思想就一句话：先验 + 数据 = 后验。公式：[P(A|B)=\frac{P(B|A)P(A)}{P(B)}]朴素贝叶斯做分类时，假设特征在给定类别下条件独...

AI-Agent面试实战...

点赞评论收藏

03-16 17:04

快手_后端开发实习生(实习员工)

腾讯二面

总时长35分钟，无手撕，感觉遇到KPI面了，唉35分钟一直在问实习，八股就问了下面的1.redis与数据库的缓存一致性2.redis的zset数据结构3.redis的两个持久化机制4.分布式cap理论5.什么时候ap，什么时候cp6.进程线程协程问怎么没手撕，说一面撕过了，业务是应用宝游戏商城，后面过了还有一面技术面，问面试表现，说挺顺的，可以再关注一下运维数据，然后问转go有难度嘛，就结束了

iiooz：别想太多了，面试官如果看不上，就不会约面了，腾讯很少所谓的kpi，有面就说明能力肯定不错，只是每个面试官筛选方式不同，二面甚至只跟你聊生活的都有，鹅还是很开放的在筛选人这一块

今天你投了哪些公司？

点赞评论收藏

全站热榜

创作者周榜

正在热议

# 春招/暑实第一面是哪家？ #

7320次浏览 107人参与

# 面试官最爱问的 AI 问题是...... #

# 把自己当AI，现在最消耗你token的问题是什么？ #

624次浏览 20人参与

# 你的嫡系AI是哪个？ #

1336次浏览 40人参与

# 你现在的工作，是“成长”还是“消耗”？ #

# 金三银四，你的春招进行到哪个阶段了？ #

带得科技 大模型应用开发 二面

1. 你们线上大模型应用的整体架构是怎样的？

2. 你们怎么做 Prompt 工程？

3. 怎么减少大模型幻觉？

4. temperature、top_p 这些参数分别是干什么的？

5. Function Calling / Tool Calling 是怎么做的？

6. 你们怎么做会话记忆？

7. 流式输出是怎么实现的？

8. 怎么控制大模

全站热榜

创作者周榜

带得科技大模型应用开发二面