阿里大模型实习一面
1. 目前主流大语言模型在架构设计上有哪些异同点?
2. 简述大语言模型中的Prompt Engineering技巧,如何设计有效的提示词提升模型输出质量?
3. 什么是LoRA?它在大语言模型微调中的优势和原理是什么?
4. 大语言模型在推理时出现“幻觉”现象的原因是什么?有哪些缓解方法?
5. 对比Zero-Shot、Few-Shot和In-Context Learning,它们在大语言模型中的应用场景和局限性分别是什么?
6. 介绍一下大语言模型中的注意力机制,多头相比单头注意力有何优势?
7.过往项目(项目/论文细节追问)
8. 如何评估大语言模型的性能?常见的评测指标和基准数据集有哪些?
9. 什么是大语言模型的“涌现能力”?目前对该现象的研究有哪些发现?
2. 简述大语言模型中的Prompt Engineering技巧,如何设计有效的提示词提升模型输出质量?
3. 什么是LoRA?它在大语言模型微调中的优势和原理是什么?
4. 大语言模型在推理时出现“幻觉”现象的原因是什么?有哪些缓解方法?
5. 对比Zero-Shot、Few-Shot和In-Context Learning,它们在大语言模型中的应用场景和局限性分别是什么?
6. 介绍一下大语言模型中的注意力机制,多头相比单头注意力有何优势?
7.过往项目(项目/论文细节追问)
8. 如何评估大语言模型的性能?常见的评测指标和基准数据集有哪些?
9. 什么是大语言模型的“涌现能力”?目前对该现象的研究有哪些发现?
全部评论
相关推荐
点赞 评论 收藏
分享
点赞 评论 收藏
分享
查看28道真题和解析 点赞 评论 收藏
分享
文远知行公司福利 560人发布