白驹之过隙

03-04 07:00 北京市海淀区简明教育培训学校 Java 发布于北京

关注

大模型应用开发

#面试___岗的必刷题单#
Transformer的自注意力机制是如何工作的？需要说明QKV矩阵的计算过程
多头注意力相比单头注意力的优势是什么？
Transformer如何感知序列顺序？解释位置编码的作用，正弦/余弦位置编码公式
BERT和GPT在注意力机制上的核心区别是什么？
大模型的预训练和微调有什么区别？各自的适用场景是什么？
什么是RAG？它解决了大模型的哪些核心痛点？

全部评论

推荐最新楼层

哈哈哈，你是老六

门头沟学院大数据开发工程师

我一个不是大模型的确实不知道这些题

点赞回复分享

发布于 03-05 18:52 北京

03-12 10:48

吉林农业大学算法工程师

带得科技大模型应用开发二面

1. 你们线上大模型应用的整体架构是怎样的？常见架构就是这几层：用户请求先进入 API 网关，再到业务服务层。业务服务层负责鉴权、限流、Prompt 拼装、会话管理、工具编排。如果有知识库，就先走检索链路；如果要调外部能力，就走工具调用；最后把上下文交给大模型生成结果。生成结果出来后，再做内容过滤、格式化、日志落库、监控上报。核心链路一般是：用户请求 -> 业务编排 -> 检索/工具 -> 模型推理 -> 后处理 -> 返回结果2. 你们怎么做 Prompt 工程？Prompt 不是简单写一句提示词，而是模板化管理。常见做法是把 Prompt 拆成几部分：syst...

查看20道真题和解析

点赞评论收藏

分享

03-10 18:55

门头沟学院推荐算法

大模型应用开发二面 1h 字节

面试很难，还是要多多练习，感觉自己说不明白业务逻辑1.写一下attention公式(代码实现了下)2.训练时为什么要mask，推理时也需要吗?两处有什么区别?推理时的sequencelength和训练时一样吗3.transformer和传统seg2seg模型有什么区别?4.计算attention时为什么要除以dk，这个dk的含义是?attention计算时还有哪些scale处理?5.attention中softmax函数作用、公式、为什么有减去最值的处理?换个函数还能这样处理吗?6.解释数值上溢、下溢问题7.讲一下prompt书写的经验，如何判断prompt是否达标何改进prompt8.讲一下SFT，会对哪部分计算loss?为什么?9.讲一下deepspeed10.训练用一个7b模型要占用多少显存?不同zero阶段能够节多少显存?11.训练模型时用了几张卡，有遇到什么异常中断问题吗?

点赞评论收藏

分享

03-12 10:26

吉林农业大学算法工程师

满帮集团大模型应用开发一面

1. xgboost 为什么叫梯度提升树因为它本质上就是：树：基学习器是 CART 回归树提升：一棵一棵往上加梯度：每一轮拟合的是损失函数对当前预测的负梯度普通提升树可以理解成拟合残差，XGBoost 是把“残差”推广成了更一般的梯度下降框架，而且用了二阶导信息，所以比传统 GBDT 更强。2. 知道什么概率模型？朴素贝叶斯，说一下贝叶斯的思想概率模型就是用概率分布描述数据和变量关系的模型，比如：朴素贝叶斯HMMCRFGMM贝叶斯网络贝叶斯思想就一句话：先验 + 数据 = 后验。公式：[P(A|B)=\frac{P(B|A)P(A)}{P(B)}]朴素贝叶斯做分类时，假设特征在给定类别下条件独...

AI-Agent面试实战...

点赞评论收藏

分享

03-10 17:45

门头沟学院推荐算法

字节实习大模型应用开发一面 90min

继续来分享下之前的面经~欢迎友好讨论，信息共享1.了解DeepSeek-R1吗?介绍一下?2.R1的MLA是如何实现KV-Cache的节约?3.R1在SFT时冷启动的目的?4.位置编码是什么?解释ROPE?5.一个14B的模型，推理和训练要多少显存?6.显存的占用和哪些因素相关?7.大模型灾难性遗忘是什么?如何解决?8.BF16、 FP16、FP32对比。9.Adam, AdamW原理。10.deepspeed的三个阶段。

点赞评论收藏

分享

03-10 22:50

中南大学 Java

27届校招必看：后端&大模型应用开发突围指南

你好，27届的同学！现在是2026年3月，26届春招已进入白热化，27届的暑期实习预热也即将开始。作为站在AI浪潮风口的一代，你们面临的机遇与挑战并存：传统后端岗位在收缩，而“后端+AI”或纯“大模型应用开发”岗位需求激增。很多大厂（如字节、阿里、腾讯）的后端JD里已经明确标注“需具备大模型开发与应用能力”。如何在这个时代合理利用AI工具，打造核心竞争力？这份实战分享贴为你拆解。一、核心认知：AI时代，后端开发变了吗？变了，也没变。没变的是：高并发、分布式、数据库优化、系统设计等后端基石依然是面试和工作的硬通货。变了的是：你不再只是写CRUD，你需要懂得如何调用大模型API、构建RAG（检索增...

27届求职交流

点赞评论收藏

分享

评论

点赞

5

招聘动态

搜狐畅游

26届春招火热进行中

莉莉丝

2026春季校园招聘

招商银行·招银网络科技

2026届校园招聘

麦吉太文

2026校园招聘

神州信息

2026届校园招聘

广发证券Fintech

2026校园招聘

小米集团

2026届春季校园招聘

翼支付

2026届春季校园招聘

厦门银行

2026届春季校园招聘

联想

26届补录&27届暑期实习

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 如何一边实习一边找下家？ #

29717次浏览 207人参与

# 职能管理面试记录 #

9177次浏览 39人参与

# 巨人网络春招 #

10022次浏览 163人参与

# 跟HR说什么能被秒回？ #

9071次浏览 161人参与

# 面试官最爱问的 AI 问题是...... #

15468次浏览 531人参与

# 春招/暑实第一面是哪家？ #

19347次浏览 221人参与

# MiniMax求职进展汇总 #

14524次浏览 232人参与

# 京东美团大战，你怎么看？ #

174046次浏览 881人参与

# 京东开奖 #

673189次浏览 3236人参与

# 你的嫡系AI是哪个？ #

4136次浏览 103人参与

# 现在入门AI应该走哪些方向？ #

4104次浏览 91人参与

# 把自己当AI，现在最消耗你token的问题是什么？ #

2848次浏览 85人参与

# 你收到了哪些公司的笔试？ #

16871次浏览 91人参与

# 巨人网络工作体验 #

74238次浏览 505人参与

# 巨人网络求职进展汇总 #

190730次浏览 1228人参与

# OPPO求职进展汇总 #

789585次浏览 5414人参与

# 不卡学历的大厂有哪些？ #

161480次浏览 685人参与

# 实习生如何通过转正 #

129857次浏览 1475人参与

# 你现在的工作，是“成长”还是“消耗”？ #

8233次浏览 143人参与

361104次浏览 2915人参与

# 迅雷笔试 #

5416次浏览 27人参与

# 联想求职进展汇总 #

340762次浏览 2229人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务