字节算法秋招一面1h

讲解项目,过程中进行提问
1.讲解Transformer 的结构。
2.为什么要进行多头注意力?
3.注意力计算的计算复杂度是多少?
4.用bert做下游任务时,输入有哪些embedding?
5.用bert做分类任务时,输出是怎么处理的?
6.在训练模型时,如果遇到loss不稳定,如何去优化?
7.常用什么训练框架?
8.讲解  LoRA 原理。
9.常用的不同模态数据在embedding层面对齐的方法有哪些?
10.多模态模型怎么训练?
11.介绍一下 CLIP 模型。
12.常用的对比学习有哪些方法?怎么构造数据的?
13.RAG检索召回的片段中,有一些质量差的,如果排除掉?
14.排序模型关注的指标是什么?
15.C++中,指针和智能指针的区别?
16.C++中,什么函数的作用?没听清,不太了解。
code:二叉树的层序遍历
反问
全部评论

相关推荐

03-26 13:04
已编辑
电子科技大学 算法工程师
xiaowl:你这个简历“条目上”都比较有深度性,但是实际上面试官又没法很好的评估你是怎么达到很多看上去很厉害的结果的。要避免一些看上去很厉害的包装,比如高效的内存复用策略的表达,如果仅是简单的一些内存共享机制,而且面试上也没有深挖的空间,就不要这样表达。比如,工程化模式本质上可能就是定义了一些abstract class,那也就没特别多值得讲的内容。建议简历上应该侧重那些你花了大量时间和精力解决、研究的问题,不要过分追求“丰富”,而是关注在技术深入度、问题解决能力的表现上。
没有实习经历,还有机会进...
点赞 评论 收藏
分享
评论
1
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务