腾讯元宝大模型算法一面分享-夯爆了

攒人品中,祝大家都能拿到满意的Offer!
项目拷打,穿插八股
1. agentic rag 和传统 rag 的区别?
2. 项目里的 agent 都调用了哪些工具?
3. 如何保证 rag 召回信息的质量?
4. 在线爬取是用的什么 api?
5. 怎么保证模型的输出不产生幻觉?
6. 对于细粒度的问题,你这套粗粒度快速定位➕细粒度精确检索的方案还有效吗?
7. rag 召回率 90%,badcase 都是什么问题,具体是哪个环节导致的?有想过怎么优化吗?
8. 整个系统中使用的模型有做训练吗?还是调的 api?
9. agent 调用工具这个过程是怎么优化的?
10. 合成数据是怎么做的,如何保证多样性?
11. lora 微调的原理,为什么小部分参数就能成功?
12. 你训练的时候主要调了哪些参数,最终比较适合的参数是多少?
13. 全量微调的劣势是什么?既然容易灾难性遗忘,有什么方法能够保证能尽可能保留模型原始能力,并让其迁移到新任务上
14. self-attention 的公式是什么?QKV 各是什么意思?
15. 模型生成时的temperature 是干嘛的,原理是什么,什么场景用什么值?
最后手撕:
lc hot100 trick题“ 寻找重复数”的升级版,重复数不止一个
全部评论

相关推荐

评论
点赞
1
分享

创作者周榜

更多
正在热议
更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务