补个2月阿里国际算法面试

1. lora参数介绍
    lora结构

2. lora是在那个module训练的

3. 其他的网络架构了解吗 mixtral啥的

4. 从英文到中文的token怎么实现 有哪些实现方法

5. BTE是什么

6. 阿里的模型 多模态模型 有了解吗

7. MOE框架 

8. lora精调和全量精调的区别

9. 预训练所用数据集大小 token大小

还有一些基础的transformer之类的 忘记了

#阿里国际#
全部评论

相关推荐

点赞 评论 收藏
分享
评论
5
15
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务