首页 > 试题广场 >

一个7B参数的Transformer模型,32层、32头、d

[单选题]
一个7B参数的Transformer模型,32层、32头、d_model=4096、使用FP16,序列长度为2048时,KV Cache占用多少显存?
  • 约512MB
  • 约1GB
  • 约2GB
  • 约4GB

这道题你会答吗?花几分钟告诉大家答案吧!