备战春招之商汤大模型一面

token 怎么 tokenizer ,怎么embedding的

词表是怎么训练的?

tokenizer是怎么tokenizer的?

添加新的token怎么加,怎么训练呢,词表会偏移吗?

llava的数据的输入输出是啥样的,整个数据的流程

GRPO有没有遇到什么问题,怎么解决

领域SFT数据损害模型的通用性能吗,怎么解决。1、加通用数据 2、model merge

怎么merge,怎么加通用数据?

手写ViT MHA

多头是怎么切分的?

手撕矩阵孤独岛屿,DFS

反问

全部评论

相关推荐

查看9道真题和解析
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务