26秋招百度大模型算法面经
一面
1.sft数据长什么样,困难case是什么样?
2.有没有考虑做数据增广,有哪些数据增广的方式?
3.query不规范,导致召回难度大,如何解决?
4.如果原始训练数据当中存在大量噪声,如何去除这些噪声对模型的影响?
5.手撕:爬楼梯
二面:
1.RAG系统的架构,每一个模块的作用,文本截断的长度是多少?
2.除了向量召回和关键词召回,还有哪些召回方式,了不了解全文召回,如何做的?
3.向量召回,关键词召回,实体召回等不同召回链路召回的结果如何合并,哪一个优先级更高?
4.query改写之后改写成什么形式去召回?
5.DPO的原理,损失函数如何计算?
6.GRPO的原理,损失函数如何计算?
7.在linux系统当中查看端口是否被占用的命令行是什么?
8.让进程在后台运行的命令行是什么?
9.如何快速对一个list去重,如果list的长度非常长(且不改变数据格式)
10.手撕:最长回文子串
1.sft数据长什么样,困难case是什么样?
2.有没有考虑做数据增广,有哪些数据增广的方式?
3.query不规范,导致召回难度大,如何解决?
4.如果原始训练数据当中存在大量噪声,如何去除这些噪声对模型的影响?
5.手撕:爬楼梯
二面:
1.RAG系统的架构,每一个模块的作用,文本截断的长度是多少?
2.除了向量召回和关键词召回,还有哪些召回方式,了不了解全文召回,如何做的?
3.向量召回,关键词召回,实体召回等不同召回链路召回的结果如何合并,哪一个优先级更高?
4.query改写之后改写成什么形式去召回?
5.DPO的原理,损失函数如何计算?
6.GRPO的原理,损失函数如何计算?
7.在linux系统当中查看端口是否被占用的命令行是什么?
8.让进程在后台运行的命令行是什么?
9.如何快速对一个list去重,如果list的长度非常长(且不改变数据格式)
10.手撕:最长回文子串
全部评论
相关推荐
11-07 11:47
东南大学 后端工程师
只会按tab的bug...:高中:这个班高考人均985,我考不上985是不是很丢人啊? 考上985本: 班里人均保研985硕了,我保不上是不是很丢人啊? 985本硕:班里人均bat了,我进不去是不是很丢人啊?进了大厂:组里人均p8年薪200w,我拿不到是不是很丢人啊?拿了p8和200w: 身边人都买房买车结婚生子了,我还没买房是不是很丢人啊?你有没有发现,每当你达到下一个目标时,你身边的人必然都是和你同个层次同样优秀的人,如果你陷入这种不断的比较,你永远会不满足。事实就是,当你拿到一个阶段的成就的时候,你就已经超过很多人很厉害很优秀了,你是不需要下一个阶段的成功来证明自己的。 点赞 评论 收藏
分享
点赞 评论 收藏
分享
查看11道真题和解析