首页 > 试题广场 >

大语言模型的上下文窗口长度限制主要源于Transformer

[单选题]

大语言模型的上下文窗口长度限制主要源于Transformer的哪个固有特性？

```
模型层数过多导致梯度不稳定
```
```
自注意力机制的计算开销过高
```
```
位置编码的表示能力有限
```
```
训练数据的覆盖范围不足
```

查看答案及解析

郑锦凡头像

郑锦凡

上下文窗口 = 大模型一次最多能同时读、能记住、能拿来思考的所有文字总量（用 token 算）。就是模型的一次性记忆上限。而Transformer 自注意力是 O (n²)文本越长计算量爆炸所以必须给一个硬性上限，这个上限就是上下文窗口。

发表于 2026-05-01 12:29:35 回复(0)

提交观点

问题信息

大模型概念

难度：

1条回答 38收藏 56浏览

热门推荐

相关试题

扫描二维码，关注牛客网
意见反馈
下载牛客APP，随时随地刷题

扫一扫，把题目装进口袋

求职之前，先上牛客: 扫描二维码，进入QQ群



扫描二维码，关注牛客公众号

公司地址：北京市朝阳区北苑路北美国际商务中心K1座一层-北京牛客科技有限公司
联系方式：010-60728802 投诉举报电话：010-57596212（朝阳人力社保局）
牛客科技© All rights reserved admin@nowcoder.com
京ICP备14055008号-4 增值电信业务经营许可证营业执照人力资源服务许可证
京公网安备 11010502036488号