补个2月阿里国际算法面试
1. lora参数介绍
lora结构
2. lora是在那个module训练的
3. 其他的网络架构了解吗 mixtral啥的
4. 从英文到中文的token怎么实现 有哪些实现方法
5. BTE是什么
6. 阿里的模型 多模态模型 有了解吗
7. MOE框架
8. lora精调和全量精调的区别
9. 预训练所用数据集大小 token大小
还有一些基础的transformer之类的 忘记了
#阿里国际#
lora结构
2. lora是在那个module训练的
3. 其他的网络架构了解吗 mixtral啥的
4. 从英文到中文的token怎么实现 有哪些实现方法
5. BTE是什么
6. 阿里的模型 多模态模型 有了解吗
7. MOE框架
8. lora精调和全量精调的区别
9. 预训练所用数据集大小 token大小
还有一些基础的transformer之类的 忘记了
#阿里国际#
全部评论
相关推荐
08-12 10:14
门头沟学院 Java 一天代码十万三:故天将降大任于斯人也,必先苦其心志,劳其筋骨,饿其体肤,空乏其身,行拂乱其所为,所以动心忍性,曾益其不能
点赞 评论 收藏
分享