商汤大模型一面
体感最难的一次面试,全程被拷打(应该是公司风格,感觉面试官人还行但是没开摄像头)
40分钟coding 40分钟拷打简历
1.线性回归/kmeans概念,手写线性回归
2.torch手撕MLA(没写出来)
3.问项目,sft/rft怎么做的,提问数据集细节
4.DAPO (项目中提到)做了哪些改进
5.多模态模型的thinking能力训练相比纯文本的 thinking训练有什么不同
6.你们训练视觉thinking的COT哪来的(答:用开源数据集/sota模型蒸馏),追问那他们的视觉cot怎么训练出来的(答:先训练文本llm,再对齐视觉vit,然后再从通用领域做rft可以泛化到垂域;