京东大模型算法实习二面

1. 为什么要用agent解决这个场景
2. 什么是agent
3. 你在里面做了哪些工作
4. 为什么要SFT
5. 训练前后区别在哪 举一个具体的例子
6. 数据怎么构建的
7. 什么平台上训练的 训练多久 学习率多少 为什么是这个学习率
8. 什么是语言模型
9. cnn能不能做语言模型
10. 现在大模型是什么架构
11. 写出伪代码 用abc 预测第四个token 告诉了我特征维度 头个数
12. 分头是怎么分的 怎么拼接
13. 场景题:做一个意图识别的分类任务,类别特别多 怎么做
全部评论

相关推荐

评论
1
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务