26校招快手大模型算法二面 1h

1.八股:RoPE(旋转位置编码)是如何用绝对位置编码实现相对位置感知的?能否从数学直觉上解释?
2.八股:vLLM 的核心原理是什么?它如何通过 PagedAttention 提升推理吞吐?
3.八股:FlashAttention v1 和 v2 的主要改进点分别是什么?它们如何减少显存访问并加速 Attention 计算?
4.八股:Qwen 在训练时采用的 “packing” 形式和“多轮对话”形式有何区别?各自对训练效率和模型能力有何影响?
5.项目:你们如何增强模型的多轮对话能力?除了增加多轮 SFT 数据,还有哪些架构或训练策略上的尝试?
6.项目:如果 RAG 生成需要融合多个文档(如 doc A 和 doc B)进行逻辑推理,你会怎么设计?若引入知识图谱,如何与生成模型结合?
7.项目:你们的 CoT(Chain-of-Thought)训练数据是如何构造的?使用 CoT 微调后的模型,对非 CoT 类任务是否有泛化增益?
8.项目:模型训练数据上线前,你们从哪些角度做质量检验?用了哪些自动化手段或人工规则?
全部评论

相关推荐

头像
2025-12-30 10:33
已编辑
门头沟学院 数据分析师
年初,小论文完成,导的项目也一时告一段落,过完春节,我想着该找份正经实习做做了。于是三月回学校,开始了与boss斗智斗勇的实习投递,也开始看excel、sql、tableau的视频。三月底吧,奋战了一个月,我获得了一份远在北京的实习offer,于是变成了北漂一族()被中介坑、被物价震惊、被工作压下头、时不时的再来几个导的任务和小论文返修意见,当然还要加上和实习生同事愉快的摸鱼、唠嗑、吃零食、吐槽导师、线下约饭,现在回想起来,反而这三个月的时间才是这一年最快乐的暑假离职回家,略微休整后继续刷题八月秋招开始,同时也要完成开题报告,投简历的时候不忘看文献,做测评的时候也要画框架图。所谓的金九银十,然而我只能看着数不尽的测评笔试ai面叹气,没有后续,让我认清了自己的处境或许试一试考公?也许是突如其来的想法、也许是家里长辈的期待、也许只是单纯的不想碰大论文,我开始学行测做申论。十一月,我开始两次线下面试,也买了第一套正装,坐在会议室里看着呜呜呀呀几百号“商业人士”,我不禁觉得更加好笑十一月底是国考的结束,也迫使我不得不转战大论文实验,跑了两三个星期的代码,紧张而刺激本以为研三是轻松愉快的,早早找到工作,做完实验,便可以到处游山玩水,没想到那毕竟是别人的研三,而不是我的。但无所谓的。明天太阳总会是亮的。不好的offer我也不为了保底而签。研三还有半年我也不能这么早草草下结论。这一年辛苦了,祝我祝你祝所有人。新年快乐!
2025年终总结
点赞 评论 收藏
分享
评论
2
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务