腾讯大模型算法面试分享

发一下问题给大家参考,攒攒人品!
1.实习拷打
2.项目拷打
3.在模型选择方面我已经了解了。总体来说,这是一个纯文本任务。虽然有图表参与其中,但你的整体评估体系是“规则打分 + 模型打分”混在一起用的进行混合评估的,也就是打分加加权。最终得分的这个逻辑吗?还是说是一个准确率的一个逻辑
4.那接下来我觉得是你们这边来进行评测的,主要是通过一些固定规则,或者说通过RUBASE,或者是code coding的评分器吧,它是一个没有大模型参与打分的机制,可以这么理解吧,它是一个固定的评测器。那我这边的还有一个问题,对,然后你这边是说你在收集云和千问的SSD以及DPo数据。o那么您能否介绍一下,您是如何分别通过千问来处理SFT和DPO数据的
5.你提到是规则和模型混合评估,那具体每一部分是怎么分工的?哪些是规则,哪些是模型?
6.收集 Claude 和 Qwen 的 SFT 和 DPO 数据,具体是怎么构造这些数据的
7.在大量模型生成数据中,如何筛选出用于训练的数据?
8.SFT 和 DPO 数据在构造过程中,分别的筛选标准是什么?
全部评论
强烈推荐!这个笔记写得很清晰 http://github.com/AccumulateMore/CV
1 回复 分享
发布于 今天 09:24 广东

相关推荐

985柜员:开发还敢还叫,全部让自测就老实了
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务