26秋招百度大模型算法面经

一面
1.sft数据长什么样,困难case是什么样?

2.有没有考虑做数据增广,有哪些数据增广的方式?

3.query不规范,导致召回难度大,如何解决?

4.如果原始训练数据当中存在大量噪声,如何去除这些噪声对模型的影响?

5.手撕:爬楼梯

二面:
1.RAG系统的架构,每一个模块的作用,文本截断的长度是多少?

2.除了向量召回和关键词召回,还有哪些召回方式,了不了解全文召回,如何做的?

3.向量召回,关键词召回,实体召回等不同召回链路召回的结果如何合并,哪一个优先级更高?

4.query改写之后改写成什么形式去召回?

5.DPO的原理,损失函数如何计算?

6.GRPO的原理,损失函数如何计算?

7.在linux系统当中查看端口是否被占用的命令行是什么?

8.让进程在后台运行的命令行是什么?

9.如何快速对一个list去重,如果list的长度非常长(且不改变数据格式)

10.手撕:最长回文子串
全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务