26秋招百度大模型算法面经
一面
1.sft数据长什么样,困难case是什么样?
2.有没有考虑做数据增广,有哪些数据增广的方式?
3.query不规范,导致召回难度大,如何解决?
4.如果原始训练数据当中存在大量噪声,如何去除这些噪声对模型的影响?
5.手撕:爬楼梯
二面:
1.RAG系统的架构,每一个模块的作用,文本截断的长度是多少?
2.除了向量召回和关键词召回,还有哪些召回方式,了不了解全文召回,如何做的?
3.向量召回,关键词召回,实体召回等不同召回链路召回的结果如何合并,哪一个优先级更高?
4.query改写之后改写成什么形式去召回?
5.DPO的原理,损失函数如何计算?
6.GRPO的原理,损失函数如何计算?
7.在linux系统当中查看端口是否被占用的命令行是什么?
8.让进程在后台运行的命令行是什么?
9.如何快速对一个list去重,如果list的长度非常长(且不改变数据格式)
10.手撕:最长回文子串
1.sft数据长什么样,困难case是什么样?
2.有没有考虑做数据增广,有哪些数据增广的方式?
3.query不规范,导致召回难度大,如何解决?
4.如果原始训练数据当中存在大量噪声,如何去除这些噪声对模型的影响?
5.手撕:爬楼梯
二面:
1.RAG系统的架构,每一个模块的作用,文本截断的长度是多少?
2.除了向量召回和关键词召回,还有哪些召回方式,了不了解全文召回,如何做的?
3.向量召回,关键词召回,实体召回等不同召回链路召回的结果如何合并,哪一个优先级更高?
4.query改写之后改写成什么形式去召回?
5.DPO的原理,损失函数如何计算?
6.GRPO的原理,损失函数如何计算?
7.在linux系统当中查看端口是否被占用的命令行是什么?
8.让进程在后台运行的命令行是什么?
9.如何快速对一个list去重,如果list的长度非常长(且不改变数据格式)
10.手撕:最长回文子串
全部评论
相关推荐
点赞 评论 收藏
分享
点赞 评论 收藏
分享
点赞 评论 收藏
分享
查看11道真题和解析