日常实习-字节-大模型算法-二面

继续来分享下之前的面经~欢迎友好讨论,信息共享
实习、项目拷打
1.图文多模态大模型发展史
2.位置编码的演变过程
3.图文对齐时一般采用哪种方式
4.模型的能力是在预训练阶段确定还是后训练结束之后
5.追问:现在后训练为啥比之前更能激发模型的能力,有哪些形式上的创新
手撕:
写多头注意力机制,加上掩码
全部评论

相关推荐

评论
点赞
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务