白驹之过隙

03-04 07:00 北京市海淀区简明教育培训学校 Java 发布于北京

关注

大模型应用开发

#面试___岗的必刷题单#
Transformer的自注意力机制是如何工作的？需要说明QKV矩阵的计算过程
多头注意力相比单头注意力的优势是什么？
Transformer如何感知序列顺序？解释位置编码的作用，正弦/余弦位置编码公式
BERT和GPT在注意力机制上的核心区别是什么？
大模型的预训练和微调有什么区别？各自的适用场景是什么？
什么是RAG？它解决了大模型的哪些核心痛点？

全部评论

推荐最新楼层

哈哈哈，你是老六

门头沟学院大数据开发工程师

我一个不是大模型的确实不知道这些题

点赞回复分享

发布于 03-05 18:52 北京

03-12 10:48

吉林农业大学算法工程师

带得科技大模型应用开发二面

1. 你们线上大模型应用的整体架构是怎样的？常见架构就是这几层：用户请求先进入 API 网关，再到业务服务层。业务服务层负责鉴权、限流、Prompt 拼装、会话管理、工具编排。如果有知识库，就先走检索链路；如果要调外部能力，就走工具调用；最后把上下文交给大模型生成结果。生成结果出来后，再做内容过滤、格式化、日志落库、监控上报。核心链路一般是：用户请求 -> 业务编排 -> 检索/工具 -> 模型推理 -> 后处理 -> 返回结果2. 你们怎么做 Prompt 工程？Prompt 不是简单写一句提示词，而是模板化管理。常见做法是把 Prompt 拆成几部分：syst...

查看20道真题和解析

点赞评论收藏

分享

03-10 18:55

门头沟学院推荐算法

大模型应用开发二面 1h 字节

面试很难，还是要多多练习，感觉自己说不明白业务逻辑1.写一下attention公式(代码实现了下)2.训练时为什么要mask，推理时也需要吗?两处有什么区别?推理时的sequencelength和训练时一样吗3.transformer和传统seg2seg模型有什么区别?4.计算attention时为什么要除以dk，这个dk的含义是?attention计算时还有哪些scale处理?5.attention中softmax函数作用、公式、为什么有减去最值的处理?换个函数还能这样处理吗?6.解释数值上溢、下溢问题7.讲一下prompt书写的经验，如何判断prompt是否达标何改进prompt8.讲一下SFT，会对哪部分计算loss?为什么?9.讲一下deepspeed10.训练用一个7b模型要占用多少显存?不同zero阶段能够节多少显存?11.训练模型时用了几张卡，有遇到什么异常中断问题吗?

点赞评论收藏

分享

03-12 10:26

吉林农业大学算法工程师

满帮集团大模型应用开发一面

1. xgboost 为什么叫梯度提升树因为它本质上就是：树：基学习器是 CART 回归树提升：一棵一棵往上加梯度：每一轮拟合的是损失函数对当前预测的负梯度普通提升树可以理解成拟合残差，XGBoost 是把“残差”推广成了更一般的梯度下降框架，而且用了二阶导信息，所以比传统 GBDT 更强。2. 知道什么概率模型？朴素贝叶斯，说一下贝叶斯的思想概率模型就是用概率分布描述数据和变量关系的模型，比如：朴素贝叶斯HMMCRFGMM贝叶斯网络贝叶斯思想就一句话：先验 + 数据 = 后验。公式：[P(A|B)=\frac{P(B|A)P(A)}{P(B)}]朴素贝叶斯做分类时，假设特征在给定类别下条件独...

AI-Agent面试实战...

点赞评论收藏

分享

03-10 17:45

门头沟学院推荐算法

字节实习大模型应用开发一面 90min

继续来分享下之前的面经~欢迎友好讨论，信息共享1.了解DeepSeek-R1吗?介绍一下?2.R1的MLA是如何实现KV-Cache的节约?3.R1在SFT时冷启动的目的?4.位置编码是什么?解释ROPE?5.一个14B的模型，推理和训练要多少显存?6.显存的占用和哪些因素相关?7.大模型灾难性遗忘是什么?如何解决?8.BF16、 FP16、FP32对比。9.Adam, AdamW原理。10.deepspeed的三个阶段。

点赞评论收藏

分享

03-17 10:33

java想转大模型应用开发

大佬们，我是民本大二非科班，现在已经学过了java，javaweb，苍穹外卖，目前刚看完redis实战篇，本来还打算接着学微服务背八股然后暑假找实习的，上个学期数据库老师推荐大模型方向，我觉得这个难加上学历不好就没在意，前天有个学长让我去了解下aiagent，然后最近感觉也都在说这个大模型应用开发，有点想往这方面靠，虽然说学过python，但是还想暑假实习，想问下有什么看法下一步怎么办这个大模型应用开发是否真的难，学习周期如何，我如果实不实习最后都搞这个，那我接着java学只是为了暑假实习（可能还找不到）会不会前功尽弃了对于考研的想法：现在学过数据结构和计组（学的一坨），还剩两个想等算法竞赛打...

点赞评论收藏

分享

评论

点赞

5

招聘动态

搜狐畅游

26届春招火热进行中

莉莉丝

2026春季校园招聘

招商银行·招银网络科技

2026届校园招聘

麦吉太文

2026校园招聘

神州信息

2026届校园招聘

广发证券Fintech

2026校园招聘

小米集团

2026届春季校园招聘

翼支付

2026届春季校园招聘

厦门银行

2026届春季校园招聘

联想

26届补录&27届暑期实习

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 如何一边实习一边找下家？ #

27107次浏览 186人参与

# 实习生如何通过转正 #

129695次浏览 1473人参与

# MiniMax求职进展汇总 #

13365次浏览 227人参与

# 跟HR说什么能被秒回？ #

8480次浏览 152人参与

# 电信求职进展汇总 #

45255次浏览 207人参与

# 春招/暑实第一面是哪家？ #

18074次浏览 219人参与

# 巨人网络春招 #

9901次浏览 163人参与

# 快手年终开大包 #

11868次浏览 97人参与

# 海信求职进展汇总 #

97947次浏览 419人参与

# 面试官最爱问的 AI 问题是...... #

14223次浏览 488人参与

# 银行笔面经互助 #

184753次浏览 1303人参与

# 把自己当AI，现在最消耗你token的问题是什么？ #

2631次浏览 82人参与

# 秋招提前批，你开始投了吗 #

729144次浏览 8459人参与

# 设计人秋招体验最好的公司 #

85989次浏览 743人参与

# 你的嫡系AI是哪个？ #

3842次浏览 102人参与

# 现在入门AI应该走哪些方向？ #

3718次浏览 85人参与

# 你收到了哪些公司的笔试？ #

16080次浏览 86人参与

# 迅雷笔试 #

5364次浏览 27人参与

# 机械人，说说你的烦心事 #

135464次浏览 1136人参与

# 你最近一次加班是什么时候？ #

114592次浏览 561人参与

# 找工作中的小确幸 #

85145次浏览 463人参与

# 实习学到最有价值的工作习惯 #

64695次浏览 491人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务