百度大模型算法面经
一面:
sft数据长什么样,困难case是什么样?
有没有考虑做数据增广,有哪些数据增广的方式?
query不规范,导致召回难度大,如何解决?
如果原始训练数据当中存在大量噪声,如何去除这些噪声对模型的影响?
手撕:爬楼梯
sft数据长什么样,困难case是什么样?
有没有考虑做数据增广,有哪些数据增广的方式?
query不规范,导致召回难度大,如何解决?
如果原始训练数据当中存在大量噪声,如何去除这些噪声对模型的影响?
手撕:爬楼梯
全部评论
相关推荐