多模态大模型面经分享-字节
面试很难,还是要多多练习,感觉自己说不明白业务逻辑
1.项目拷打
2.讲一下你用的大模型是什么结构,特征是怎么喂给大模型的
3.讲一下multi-head attention,用pytorch手撕一下,要可以实现cross attention的
4.大模型训练为什么不用SFT
5.知道RLHF吗,讲一下训练流程
6.问了几个电商相关的场景题,用大模型解决 prompt 应该怎么设计,怎么处理prompt的输出,怎么过滤错误格式的输出
1.项目拷打
2.讲一下你用的大模型是什么结构,特征是怎么喂给大模型的
3.讲一下multi-head attention,用pytorch手撕一下,要可以实现cross attention的
4.大模型训练为什么不用SFT
5.知道RLHF吗,讲一下训练流程
6.问了几个电商相关的场景题,用大模型解决 prompt 应该怎么设计,怎么处理prompt的输出,怎么过滤错误格式的输出
全部评论
相关推荐
查看9道真题和解析