高德大模型算法 校招一面 攒人品
攒攒人品!有面试过同岗的朋友欢迎评论区交流
1.LoRA时如何选择合适的参数?这些参数的选择如何影响模型的性能?
2.LoRA优势?
3.大模型如何通过人工指标来评估效果?有哪些常用的人工指标?
4.Transformer的计算复杂度主要由哪些因素构成?各模块复杂度分别是多少?
5.Transformer中哪个模块的计算量最大?如何优化Transformer中计算量最高的部分?
6.为什么BGE通常表现得比BERT更好?有哪些独特之处?
7.在大模型参数如何影响模型的学习和优化?
8.在模型加速方面,Deepspeed的Zero-1, Zero-2, Zero-3分别有哪些区别?
9.Transformer的自注意力中,KV-Cache的引入有什么作用?它如何帮助加速推理过程?
1.LoRA时如何选择合适的参数?这些参数的选择如何影响模型的性能?
2.LoRA优势?
3.大模型如何通过人工指标来评估效果?有哪些常用的人工指标?
4.Transformer的计算复杂度主要由哪些因素构成?各模块复杂度分别是多少?
5.Transformer中哪个模块的计算量最大?如何优化Transformer中计算量最高的部分?
6.为什么BGE通常表现得比BERT更好?有哪些独特之处?
7.在大模型参数如何影响模型的学习和优化?
8.在模型加速方面,Deepspeed的Zero-1, Zero-2, Zero-3分别有哪些区别?
9.Transformer的自注意力中,KV-Cache的引入有什么作用?它如何帮助加速推理过程?
全部评论
相关推荐
鳕鱼堡ouo:别去。。。除了你的+2和hr其他人都不知道你的工资。也就是说你拿着最低的工资干着和别人一样的活承受着和别人一样的压力,同事半夜拉会也一样会拉你,辛苦和钱多至少得占一样吧,劝退价的话真没必要了
点赞 评论 收藏
分享

查看11道真题和解析