快手LLM大模型实习一面 80min

1、实习介绍
2、reward函数是如何设计的?数据集的配比是怎样的?
3、inductive learning和transductive learning有什么区别?
4、Viking是什么?相关业务背景是什么?
5、冷启动时,不同专家模型特征输入为什么不同?
6.编码树如何构建?为什么使用高斯分布?
7、id特征为什么学习效果不好?
8、给你整数 delay 和 forget,以及整数 n。每个人在发现秘密后的 delay 天开始,每天可以分享给一个新的人。在发现秘密 forget 天后会忘记秘密,忘记后不再分享。求第 n 天结束时知道秘密的人数。
9、Loss乘10和学习率乘10之间有什么区别
全部评论

相关推荐

评论
1
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务