美团 暑期实习 大模型 二面
鼠鼠急性咽炎好几天了,下午还发39度高烧,本来想联系换时间的,但考虑现在hc基本发完了,再延期不知道会不会影响,去校医室开了点退烧药
手撕:hot100 层序遍历,秒了说下复杂度
聊项目,跟面试官讲了项目背景、遇到的难点,中间面试官会打断提问题
之后面试官对整体的训练流程比较质疑,问CPT后为什么需要sft?跟CPT的区别是什么,我解释了好几次,从训练目的、数据差异等角度都解释了,但面试官还是没明白,让我写下两者的loss,从loss的角度去解释,我就写了个基于上下文去预测next token的交叉熵,然后解释说无论是pt还是sft,loss都是交叉熵,区别在于给定的上下文,或者数据不同,结果面试官问这是交叉熵吗,把哥们干蒙了,面试结束之后去查了下交叉熵,确实没毛病啊,不是很懂
考虑北京还是上海
到岗时间、实习时长
反问
业务场景
商品、商家方向(比如用bert预测品类,现在会用大模型打标签),维度理解,品类、属性,商品信息的优化,商家的助手(用户评论、优化),用户增长,广告素材的生成
好吧,没听懂,不知道算不算搜广推,鼠鼠只会训垂域大模型,有没有uu知道这是啥方向
用到的技术
偏应用,不会做大规模训练,会有微调
资源
没说具体数量,只说还行
总结
面试官挺有礼貌的,开始还会自我介绍,没八股,鼠鼠脑袋有点昏沉,面试过程中有些地方感觉也没有表述的很清楚,在讨论训练流程那一块跟面试官卡了挺久,不知道会不会因为这点挂我,