大模型实习面试

都是实习转岗面试

京东健康
1、GLM 介绍、训练任务、训练时间、训练数据格式、训练输出、GLM训练任务优势
2、大模型具体分类
3、大模型的解码策略:贪婪解码、随机采样、BeamSearch
4、Transformer 注意力怎么算、Q K V怎么得到的 mask attention decoder的输入和输出怎么实现的

手撕:无重复最小子串

京东AIGC
1、GLM介绍,尽量详细
2、Lora,p-tuning等sft方法介绍,lora秩选取,64还是128,lora和p-tuning实际效果对比
3、介绍旋转位置编码,百川,千问,llama用的什么位置编码,旋转位置编码为什么比绝对位置编码更好
4、项目细节,如数据量、训练时长、prompt设计思路等

手撕:最长公共前缀

全部评论

相关推荐

1 10 评论
分享
牛客网
牛客企业服务