滴滴agent算法一面

实习+项目:
1. 详细介绍项目背景  结合业务场景
2. 生成的训练数据,具体是怎么生成的?
3. 数据增强是怎么做的?
4. 怎么确保更大更复杂模型的结果,是100%正确的?  有没有量化指标可以确认
5. 怎么样确保,把工具调用的轨迹 ,融入到种子数据集里面, promot是怎么设计的
6. 除了lora以外 ,还了解其它的一些微调方法吗?
7. 为什么lora的微调效果比较好?
8. 切分策略是什么?
9. 语义切分策略和固定大小切块分割策略,效果对比. 有哪些不一样的方面?

八股:
1. transformer的原理
2. attention的公式
3. 为什么除以根号dk

算法:

字符串解码

面试回答的并不好,算法题未a出来。还是要好好沉淀
全部评论

相关推荐

点赞 评论 收藏
分享
评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务