百度NLP大模型算法暑期一面
发点面经攒攒人品~
算法题:
对话历史构造
输入一个 List,包含 session_id、turn_id、query、answer 四列
输入不保证按 turn_id 有序
输出要求:在原始数据基础上增加 history 列,表示当前轮次之前的历史对话内容
1.问实习项目
2.项目解决的是什么问题
3.训练数据来源
4.DPO 训练数据格式
5.训练时有没有考虑模型泛化能力
6.如何解决模型死循环问题
7.解释为什么会有模型死循环问题
8.压缩向量的具体形式
9.更倾向于研究型工作还是面向业务的工作
算法题:
对话历史构造
输入一个 List,包含 session_id、turn_id、query、answer 四列
输入不保证按 turn_id 有序
输出要求:在原始数据基础上增加 history 列,表示当前轮次之前的历史对话内容
1.问实习项目
2.项目解决的是什么问题
3.训练数据来源
4.DPO 训练数据格式
5.训练时有没有考虑模型泛化能力
6.如何解决模型死循环问题
7.解释为什么会有模型死循环问题
8.压缩向量的具体形式
9.更倾向于研究型工作还是面向业务的工作
全部评论
相关推荐
牛客41664080...:切片粒度问得好
点赞 评论 收藏
分享
查看16道真题和解析