补个2月阿里国际算法面试

1. lora参数介绍
    lora结构

2. lora是在那个module训练的

3. 其他的网络架构了解吗 mixtral啥的

4. 从英文到中文的token怎么实现 有哪些实现方法

5. BTE是什么

6. 阿里的模型 多模态模型 有了解吗

7. MOE框架 

8. lora精调和全量精调的区别

9. 预训练所用数据集大小 token大小

还有一些基础的transformer之类的 忘记了

#阿里国际#
全部评论

相关推荐

2025-12-31 18:42
复旦大学 Java
点赞 评论 收藏
分享
2025-12-01 13:39
已编辑
东北大学 Java
Rain_Codin...:没事,反正都是吹牛逼的,另一个实习生说能实习到毕业,说不定干两个月就跑了,亏的还是他
点赞 评论 收藏
分享
评论
5
15
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务