腾讯大模型算法面试分享

发一下问题给大家参考,攒攒人品!
1.实习拷打
2.项目拷打
3.在模型选择方面我已经了解了。总体来说,这是一个纯文本任务。虽然有图表参与其中,但你的整体评估体系是“规则打分 + 模型打分”混在一起用的进行混合评估的,也就是打分加加权。最终得分的这个逻辑吗?还是说是一个准确率的一个逻辑
4.那接下来我觉得是你们这边来进行评测的,主要是通过一些固定规则,或者说通过RUBASE,或者是code coding的评分器吧,它是一个没有大模型参与打分的机制,可以这么理解吧,它是一个固定的评测器。那我这边的还有一个问题,对,然后你这边是说你在收集云和千问的SSD以及DPo数据。o那么您能否介绍一下,您是如何分别通过千问来处理SFT和DPO数据的
5.你提到是规则和模型混合评估,那具体每一部分是怎么分工的?哪些是规则,哪些是模型?
6.收集 Claude 和 Qwen 的 SFT 和 DPO 数据,具体是怎么构造这些数据的
7.在大量模型生成数据中,如何筛选出用于训练的数据?
8.SFT 和 DPO 数据在构造过程中,分别的筛选标准是什么?
全部评论

相关推荐

04-19 18:50
已编辑
长沙学院 Java
个人背景:学院二本计科专业 大二开始实习个人经历:安克创新 、理想汽车、字节跳动碎碎念:我做事只有三分钟热度。看到进了大厂的同学,我会羡慕,也会跟着努力上进;但遇到好看的小说,我又会放下手头的事沉迷其中,之前的坚持也就中断了。我有些自卑,总觉得自己学历和外貌都不够好。之前偶然在网上受到关注,我就喜欢上了上网,因为这里有很多人认可我。但我也很在意别人的评价,偶尔看到嘲讽的言论,会触发我的自卑情绪,让我感到愤怒。有时候我会强硬地回怼,有时候又会懦弱地选择无视。我也有虚荣心。不管是拿到安克、理想还是字节的机会,我在分享的时候都会带着这份心思。我会特意强调自己学历不好,是为了衬托出过程的艰难,以此显得自己更厉害。我知道,人往往会炫耀自己缺少的东西,来掩盖内心的空洞。我总想着走捷径,不太喜欢踏踏实实地做事。找实习的时候,我花了更多时间在研究面试技巧上,而不是提升专业能力。我会反复听面试录音分析技巧,看面试教程学习怎么和不同的面试官沟通,还会每天自言自语练习语言表达,同学都觉得我有点奇怪。我的实习生涯里,侥幸和运气占了很大一部分。我总在想,如果有一天我失去了这份幸运,这些特质可能会让我一蹶不振。ps: 很多人会问我学习路线和经验 但是就像我上面说的 我的实习过程靠的很多是关键节点的运气 技术上面我可能不如很多人  所以请大家理性求助和理性参考我的回答 附上我的投递记录
我的offer在哪里...:从去年看到现在,飞升哥就是榜样
我的求职进度条
点赞 评论 收藏
分享
点赞 评论 收藏
分享
评论
点赞
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务