快手NLP大模型算法校招一面
1.为什么用 DPO,你的 DPO 数据从哪里来的?
2.为什么用 reject sampling 而不是从其他商业 api 蒸馏正反样本?
3.RAG 会吗?为什么文档类的 rag 你没做分段?
4.介绍一下 Bert,Bert mask 怎么起作用的?
5.MTP 介绍一下, 里面的计算公式打开一下讲一下,为什么会加快 inference?
6.GRPO 中的公式讲一下,你在实际使用的时候那个 pi_theta 和 pi_old 了解吗?有没有手推过公式?
7.手撕: 链表倒排
2.为什么用 reject sampling 而不是从其他商业 api 蒸馏正反样本?
3.RAG 会吗?为什么文档类的 rag 你没做分段?
4.介绍一下 Bert,Bert mask 怎么起作用的?
5.MTP 介绍一下, 里面的计算公式打开一下讲一下,为什么会加快 inference?
6.GRPO 中的公式讲一下,你在实际使用的时候那个 pi_theta 和 pi_old 了解吗?有没有手推过公式?
7.手撕: 链表倒排
全部评论
相关推荐
02-12 20:22
重庆大学 Java
Jasonnnnnn...:直接把项目代码喂给AI然后让它帮你分析,如果组里已经有一些流程图总结的话最好,没有的话自己画一个
Go的话其实只要把基础语法搞明白就行了,项目里很多都是直接让ai帮你写好然后自己稍微改下,不用学的特别深
ai的话,可以自己写一些md文件来搞点小东西,但除非你打算转算法,否则不用把rag langchain学的特别深,了解下就行了
字节跳动公司福利 1371人发布 点赞 评论 收藏
分享
点赞 评论 收藏
分享