26秋招百度大模型算法面经

一面
1.sft数据长什么样,困难case是什么样?

2.有没有考虑做数据增广,有哪些数据增广的方式?

3.query不规范,导致召回难度大,如何解决?

4.如果原始训练数据当中存在大量噪声,如何去除这些噪声对模型的影响?

5.手撕:爬楼梯

二面:
1.RAG系统的架构,每一个模块的作用,文本截断的长度是多少?

2.除了向量召回和关键词召回,还有哪些召回方式,了不了解全文召回,如何做的?

3.向量召回,关键词召回,实体召回等不同召回链路召回的结果如何合并,哪一个优先级更高?

4.query改写之后改写成什么形式去召回?

5.DPO的原理,损失函数如何计算?

6.GRPO的原理,损失函数如何计算?

7.在linux系统当中查看端口是否被占用的命令行是什么?

8.让进程在后台运行的命令行是什么?

9.如何快速对一个list去重,如果list的长度非常长(且不改变数据格式)

10.手撕:最长回文子串
全部评论

相关推荐

只会按tab的bug...:高中:这个班高考人均985,我考不上985是不是很丢人啊? 考上985本: 班里人均保研985硕了,我保不上是不是很丢人啊? 985本硕:班里人均bat了,我进不去是不是很丢人啊?进了大厂:组里人均p8年薪200w,我拿不到是不是很丢人啊?拿了p8和200w: 身边人都买房买车结婚生子了,我还没买房是不是很丢人啊?你有没有发现,每当你达到下一个目标时,你身边的人必然都是和你同个层次同样优秀的人,如果你陷入这种不断的比较,你永远会不满足。事实就是,当你拿到一个阶段的成就的时候,你就已经超过很多人很厉害很优秀了,你是不需要下一个阶段的成功来证明自己的。
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务