字节LLM算法一面

1.介绍项目,围绕提问
2.为什么要进行多头注意力?
3.排序模型关注的指标是什么?
4.常用的对比学习有哪些方法?怎么构造数据的?
5.用bert做分类任务时,输出是怎么处理的?
6.在训练模型时,如果遇到loss不稳定,如何去优化?
7.讲解Transformer 的结构常用什么训练框架?
8.讲解  LoRA 原理。
9.常用的不同模态数据在embedding层面对齐的方法有哪些?
10.多模态模型怎么训练?
11.介绍一下 CLIP 模型。
12.用bert做下游任务时,输入有哪些embedding?
13.RAG检索召回的片段中,有一些质量差的,如果排除掉?
14.注意力计算的计算复杂度是多少?
15.C++中,指针和智能指针的区别?
16.code:二叉树的层序遍历
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
全部评论
佬,你面的是哪个部门啊 考这么多八股吗
点赞 回复 分享
发布于 10-02 15:16 河南
请问层序遍历需要从头建树吗
点赞 回复 分享
发布于 10-02 13:53 上海

相关推荐

评论
1
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务