26校招|高德大模型算法岗面试一面
1.LoRA时如何选择合适的参数?这些参数的选择如何影响模型的性能?
2.LoRA优势?
3.大模型如何通过人工指标来评估效果?有哪些常用的人工指标?
4.Transformer的计算复杂度主要由哪些因素构成?各模块复杂度分别是多少?
5.Transformer中哪个模块的计算量最大?如何优化Transformer中计算量最高的部分?
6.为什么BGE通常表现得比BERT更好?有哪些独特之处?
7.在大模型参数如何影响模型的学习和优化?
8.在模型加速方面,Deepspeed的Zero-1, Zero-2, Zero-3分别有哪些区别?
9.Transformer的自注意力中,KV-Cache的引入有什么作用?它如何帮助加速推理过程?
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
2.LoRA优势?
3.大模型如何通过人工指标来评估效果?有哪些常用的人工指标?
4.Transformer的计算复杂度主要由哪些因素构成?各模块复杂度分别是多少?
5.Transformer中哪个模块的计算量最大?如何优化Transformer中计算量最高的部分?
6.为什么BGE通常表现得比BERT更好?有哪些独特之处?
7.在大模型参数如何影响模型的学习和优化?
8.在模型加速方面,Deepspeed的Zero-1, Zero-2, Zero-3分别有哪些区别?
9.Transformer的自注意力中,KV-Cache的引入有什么作用?它如何帮助加速推理过程?
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
全部评论
相关推荐