AI面试问题分享
#AI面试问题分享#
1、Transformer 为什么能替代 RNN?自注意力机制的核心作用是什么?
2、请解释一下 QKV 的计算过程,以及为什么要除以 sqrt(dk)。
3、BERT 和 GPT 的区别是什么?各自更适合哪些任务?
4、训练大模型时,过拟合一般怎么处理?常见优化手段有哪些?
5、微调、LoRA、Prompt Engineering 分别适用于什么场景?
6、什么是幻觉问题?在实际业务里可以怎么缓解?
7、RAG 的基本流程是什么?它和直接微调模型相比有什么优缺点?
8、如果让你设计一个智能问答系统,你会怎么做模型选型、知识库检索和效果评估?
1、Transformer 为什么能替代 RNN?自注意力机制的核心作用是什么?
2、请解释一下 QKV 的计算过程,以及为什么要除以 sqrt(dk)。
3、BERT 和 GPT 的区别是什么?各自更适合哪些任务?
4、训练大模型时,过拟合一般怎么处理?常见优化手段有哪些?
5、微调、LoRA、Prompt Engineering 分别适用于什么场景?
6、什么是幻觉问题?在实际业务里可以怎么缓解?
7、RAG 的基本流程是什么?它和直接微调模型相比有什么优缺点?
8、如果让你设计一个智能问答系统,你会怎么做模型选型、知识库检索和效果评估?
全部评论
相关推荐
查看27道真题和解析