阿里云大模型算法二面 50min

1、业务介绍
2、交叉熵
3、都知道哪些vllm的优化技术?
4、logistic回归公式
5、logistic回归的模型原理和loss
6、给定一个时间序列,如何通过机器学习的方法进行建模筛选出来重要的特征,然后基于规则方法进行建模
7、DeepSeek-MTP是用在训练阶段还是推理阶段的,具体过程是怎样的?
8、在现有大模型的基础上,如何通过agent的相关方法,训练一个coder模型,撰写金融领域相关模型的代码。
全部评论

相关推荐

01-30 09:45
燕山大学 Java
喵_coding:这种直接跑就完事了 哪有毕业了才签合同 任何offer和三方都没有的
点赞 评论 收藏
分享
评论
2
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务