美团 暑期实习 大模型 二面

鼠鼠急性咽炎好几天了,下午还发39度高烧,本来想联系换时间的,但考虑现在hc基本发完了,再延期不知道会不会影响,去校医室开了点退烧药

手撕:hot100 层序遍历,秒了说下复杂度

聊项目,跟面试官讲了项目背景、遇到的难点,中间面试官会打断提问题

之后面试官对整体的训练流程比较质疑,问CPT后为什么需要sft?跟CPT的区别是什么,我解释了好几次,从训练目的、数据差异等角度都解释了,但面试官还是没明白,让我写下两者的loss,从loss的角度去解释,我就写了个基于上下文去预测next token的交叉熵,然后解释说无论是pt还是sft,loss都是交叉熵,区别在于给定的上下文,或者数据不同,结果面试官问这是交叉熵吗,把哥们干蒙了,面试结束之后去查了下交叉熵,确实没毛病啊,不是很懂

考虑北京还是上海

到岗时间、实习时长

反问

业务场景

商品、商家方向(比如用bert预测品类,现在会用大模型打标签),维度理解,品类、属性,商品信息的优化,商家的助手(用户评论、优化),用户增长,广告素材的生成

好吧,没听懂,不知道算不算搜广推,鼠鼠只会训垂域大模型,有没有uu知道这是啥方向

用到的技术

偏应用,不会做大规模训练,会有微调

资源

没说具体数量,只说还行

总结

面试官挺有礼貌的,开始还会自我介绍,没八股,鼠鼠脑袋有点昏沉,面试过程中有些地方感觉也没有表述的很清楚,在讨论训练流程那一块跟面试官卡了挺久,不知道会不会因为这点挂我,

#算法##大厂##大模型##暑期实习##美团#
全部评论
加油鼠鼠
点赞 回复 分享
发布于 04-23 02:20 陕西

相关推荐

评论
2
9
分享

创作者周榜

更多
牛客网
牛客企业服务