阿里大模型实习一面

1. 目前主流大语言模型在架构设计上有哪些异同点?
2. 简述大语言模型中的Prompt Engineering技巧,如何设计有效的提示词提升模型输出质量?
3. 什么是LoRA?它在大语言模型微调中的优势和原理是什么?
4. 大语言模型在推理时出现“幻觉”现象的原因是什么?有哪些缓解方法?
5. 对比Zero-Shot、Few-Shot和In-Context Learning,它们在大语言模型中的应用场景和局限性分别是什么?
6. 介绍一下大语言模型中的注意力机制,多头相比单头注意力有何优势?
7.过往项目(项目/论文细节追问)
8. 如何评估大语言模型的性能?常见的评测指标和基准数据集有哪些?
9. 什么是大语言模型的“涌现能力”?目前对该现象的研究有哪些发现?
全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务