首页 > 试题广场 >

当观察到大型Transformer模型在长文本推理时出现上下

[单选题]

当观察到大型Transformer模型在长文本推理时出现上下文丢失现象，最可能由什么架构限制引起？

```
位置编码外推失效
```
```
残差连接梯度消失
```
```
前馈网络宽度不足
```
```
层归一化计算误差累积
```

查看正确选项

爱跳的Mario头像

爱跳的Mario

位置编码外推失效是Transformer模型在长文本推理中出现上下文丢失的最常见架构限制

发表于 2026-04-10 22:08:02 回复(0)

提交观点

问题信息

大模型概念

难度：

1条回答 83收藏 169浏览

热门推荐

相关试题

扫描二维码，关注牛客网
意见反馈
下载牛客APP，随时随地刷题

扫一扫，把题目装进口袋

求职之前，先上牛客: 扫描二维码，进入QQ群



扫描二维码，关注牛客公众号

公司地址：北京市朝阳区北苑路北美国际商务中心K1座一层-北京牛客科技有限公司
联系方式：010-60728802 投诉举报电话：010-57596212（朝阳人力社保局）
牛客科技© All rights reserved admin@nowcoder.com
京ICP备14055008号-4 增值电信业务经营许可证营业执照人力资源服务许可证
京公网安备 11010502036488号