03-19 14:51 已编辑广西大学算法工程师发布于河北

关注

盖立克思大模型开发一面

1、自我介绍

2、介绍一下你做的这个智能问答的项目

3、Transformer 结构

Transformer 是当前大模型最核心的基础架构之一，它抛弃了传统 RNN 按时间步顺序计算的方式，主要依赖自注意力机制来建模序列中不同位置之间的关系。它最大的优势是并行能力强，而且对长距离依赖的建模效果更好。

从整体结构上看，标准 Transformer 由 Encoder 和 Decoder 两部分组成。Encoder 负责把输入序列编码成高维表示，Decoder 负责结合历史输出逐步生成结果。每一层 Encoder 一般包含两个核心子层：Multi-Head Self-Attention 和 Feed Forward Network，并且每个子层外面都会加残差连接和 LayerNorm。Decoder 的结构和 Encoder 类似，只不过多了一个 Masked Self-Attention，用来保证生成当前 token 时不能看到未来信息，同时还会有一个和 Encoder 输出交互的 Cross-Attention。

Attention 的计算核心是这几个公式。先由输入映射出 Query、Key、Value：

然后计算注意力分数：

Multi-Head Attention 本质上是做多组不同的线性映射，让模型从多个子空间去理解信息，再把多个 head 的结果拼接起来。

如果放到大模型里理解，现在很多主流模型其实已经不再使用完整 Encoder-Decoder，而是更多采用 Decoder-Only 架构。原因是它更适合统一做自回归生成任务，训练目标和推理方式也更一致。

4、LangChain 中的主要模块

LangChain 本质上是一个帮助开发大模型应用的框架，它不是模型本身，而是把模型调用、Prompt、检索、记忆、工具和链路编排这些能力组织起来。它的主要模块可以从几个部分来理解。

第一部分是 Models，也就是模型接口层，用来统一接入不同的大语言模型、聊天模型和 Embedding 模型。第二部分是 Prompts，用来组织提示词模板，把变量、上下文和任务要求规范化。第三部分是 Chains，也就是链式调用，把多个步骤串起来，比如“先检索再生成”或者“先抽取再总结”。第四部分是 Memory，用来管理多轮对话历史，让系统在连续交互中保留上下文。

剩余60%内容，订阅专栏后可继续查看/也可单篇购买

AI-Agent面试实战专栏文章被收录于专栏

本专栏聚焦 AI-Agent 面试高频考点，内容来自真实面试与项目实践。系统覆盖大模型基础、Prompt工程、RAG、Agent架构、工具调用、多Agent协作、记忆机制、评测、安全与部署优化等核心模块。以“原理+场景+实战”为主线，提供高频题解析、标准答题思路与工程落地方法，帮助你高效查漏补缺.

全部评论

推荐最新楼层

03-20 16:53

门头沟学院 Java

热查询，冷查询，解决方案

ps：如果这篇帖子对于还在找工作和找实习的你有所帮助，可以关注我，给本贴点赞、评论、收藏并订阅专栏；同时不要吝啬您的花花一、核心概念界定热查询、冷查询是基于数据访问频次、响应时效要求、业务价值划分的两类查询场景，核心差异体现在访问频率、资源消耗、用户容忍度三个维度，是大数据、分布式系统、数据库优化中最常见的性能瓶颈场景。1.1 热查询定义与特征热查询是针对高频访问、低延迟要求的热数据发起的查询请求，热数据多为近期产生、核心业务流转、用户高频触发的数据（如近30天订单、商品详情、用户活跃信息）。访问特征：QPS高、并发量大、请求集中，单次查询数据量小，要求毫秒级响应；业务场景：电商商品查询、用户...

点赞评论收藏

分享

04-30 21:25

门头沟学院 Java

快手日常实习后端ai开发一面 30m

给我面没招了，发点面经攒攒人品～1.实习拷打2.相关报警的知识库的处理sop是怎样维护的3.检索的时候会不会出现不是想要的或者检索不出来的4.如果遇到查不到的情况，如何去优化使能检索出想要的东西5.新增的时候如何处理幂等的问题6.两个订单号是同一个相似的订单内容，即重复提交了相同的订单，如何做7.查询方面如果接口查询比较差，如何去优化8.分布式事务讲一下9.算法：在 D 天内送达包裹的能力

查看8道真题和解析

点赞评论收藏

分享

03-20 10:23

科大讯飞_教育BG_后端开发(准入职员工)

入门AI应该要先会用AI

入门AI首先要关注应该如何使用AI，使用现成的AI工具进行提效。比如说如何使用豆包进行高效的提问获取资料，如何使用即梦生成想要的图片，如何利用剪映剪出想要的视频，如何利用飞书的AI制作表格，如何使用扣子的编写自己的工作流。无论学什么，最重要的是行动，我推荐可以入门学习一下提示词应该要怎么写。#现在入门AI应该走哪些方向？#

点赞评论收藏

分享

05-05 15:10

已编辑

未填写教育信息后端工程师

后端校招offer二选一求帮选

投票

1️⃣ 京东物流  (n+1)*16优点：1. 校招培养和内部升职涨薪可能更好2. 后续跳槽认可度可能更高缺点：1. 卷，据说91052. 概率触发竞业？有没有清楚的老师可以说说京东技术的竞业概率3. 公积金比例低，5%4. 年假少，5天5. base有20%的绩效占比（但好像一般都能拿满？2️⃣ 虾皮供应链 n*15 + 5w + 12w/4优点：1. 相对wlb，据hr说930-7-52. 年假15天，带薪病假14天3. 公积金比例高，10%缺点：1. 裁应届风险？有没有清楚的老师可以说说现在还裁应届吗比例多少2. 跳槽title和内部成长与晋升可能不如京东？3. 供应链卷/风评差，可能九点下班4. 年终可能发不满，只有1.5个月二者其实总包差不太多，钱方面可以忽略，这俩部门也是各有各的名声差，，，京东在北京，虾皮在深圳，略偏向深圳但北京也可以接受

点赞评论收藏

分享

03-14 09:57

广西大学算法工程师

度小满大模型开发一面

1、知道 GPT 和 BERT 这种模型的基础框架是怎样的吗BERT 和 GPT 都是基于 Transformer 的预训练模型，但结构和任务目标不一样。BERT 一般采用 Transformer Encoder 堆叠起来的双向编码结构，在预训练时主要做 MLM，也就是随机遮盖一部分 token，让模型根据上下文去恢复被遮掉的词，因此它更适合理解类任务，比如分类、匹配、抽取、检索表示学习。GPT 采用 Transformer Decoder 堆叠起来的单向自回归结构，在预训练时做 next token prediction，也就是根据前面的 token 预测下一个 token，因此它更适合生成...

AI-Agent面试实战...

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 如果春招能重来，我会___ #

24650次浏览 256人参与

# 有深度的简历长什么样？ #

59314次浏览 758人参与

# 在爱玛，骑向未来 #

15971次浏览 344人参与

# 这个offer值得去吗？ #

24361次浏览 192人参与

# 美团笔试 #

987753次浏览 5810人参与

# 你会因为行情，降低找工作标准吗？ #

37863次浏览 300人参与

# 联宝杯大学生创新大赛，你的技术值得产业级答案 #

48468次浏览 585人参与

# 刚入职就____，这样正常吗？ #

144928次浏览 696人参与

# 你见过最离谱的招聘要求是什么？ #

281298次浏览 1887人参与

# 字节开奖 #

154317次浏览 730人参与

# 面试常问题系列 #

307169次浏览 4797人参与

# 上班苦还是上学苦呢？ #

345963次浏览 2076人参与

# 实习怎么做才有更好的产出 #

50378次浏览 462人参与

# 找工作，你都让AI帮你做什么？ #

33903次浏览 290人参与

# 大学四年该怎么过，才不算浪费时间？ #

24078次浏览 108人参与

# 字节求职进展汇总 #

1852730次浏览 15454人参与

# 双非应该如何逆袭？ #

590150次浏览 6421人参与

# 今年形式下双非本找得到工作吗 #

329242次浏览 1776人参与

# 我的秋招“寄”录 #

476825次浏览 3065人参与

# 双非本科求职如何逆袭 #

1653016次浏览 13109人参与

# 实习生活中那些难忘的瞬间 #

344509次浏览 3442人参与

# 你被哪些公司挂了？ #

193677次浏览 1046人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务