补个2月阿里国际算法面试
1. lora参数介绍
lora结构
2. lora是在那个module训练的
3. 其他的网络架构了解吗 mixtral啥的
4. 从英文到中文的token怎么实现 有哪些实现方法
5. BTE是什么
6. 阿里的模型 多模态模型 有了解吗
7. MOE框架
8. lora精调和全量精调的区别
9. 预训练所用数据集大小 token大小
还有一些基础的transformer之类的 忘记了
#阿里国际#
lora结构
2. lora是在那个module训练的
3. 其他的网络架构了解吗 mixtral啥的
4. 从英文到中文的token怎么实现 有哪些实现方法
5. BTE是什么
6. 阿里的模型 多模态模型 有了解吗
7. MOE框架
8. lora精调和全量精调的区别
9. 预训练所用数据集大小 token大小
还有一些基础的transformer之类的 忘记了
#阿里国际#
全部评论
相关推荐