商汤大模型一面

体感最难的一次面试,全程被拷打(应该是公司风格,感觉面试官人还行但是没开摄像头)

40分钟coding 40分钟拷打简历

1.线性回归/kmeans概念,手写线性回归

2.torch手撕MLA(没写出来)

3.问项目,sft/rft怎么做的,提问数据集细节

4.DAPO (项目中提到)做了哪些改进

5.多模态模型的thinking能力训练相比纯文本的 thinking训练有什么不同

6.你们训练视觉thinking的COT哪来的(答:用开源数据集/sota模型蒸馏),追问那他们的视觉cot怎么训练出来的(答:先训练文本llm,再对齐视觉vit,然后再从通用领域做rft可以泛化到垂域;

全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务