滴滴26秋招算法二面

八股文:
1.为什么图像要划分 patch,对应物理含义,对比联系 nlp 文本
2.不同 loss 应用任务场景,解释 loss 怎么算
3.lora 原理,初始化,为什么,对比 sft
4.图像分割任务数据少,不同场景数量不均衡怎么解决,过拟合欠拟合,怎么解决,除了加数据呢,除了改loss 呢(还说了数据增强)
5.训练网络过程的一些优化
6.batchnorm和layernorm 区别,为什么用,在哪里用
7.attention 及其变体原理,cross attention 的 qkv 来自哪里
8.其他的记不太起来了,都是基于简历和组内业务的延伸好像,总结来说都不难,

简历拷打内容:
1.自述最得意的 paper 和实习*1,你觉得你做得最好的一点在哪里,
2.期间穿插模块细节询问,实现手段,觉得有什么问题,怎么改进,
3.询问自己做的一个小 demo,各个模块设置的动机,然后开始压力我
全部评论

相关推荐

12-05 10:31
门头沟学院 Java
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务