字节筋斗云机器学习工程师二面
很奇怪, 这种完全不匹配,还能过我到二面。。。
这个组做推荐业务的,也不设计大模型推荐,。。。所以感觉面试官也不知道问我啥
1.自我介绍
2.针对一个项目介绍
3.你觉得怎么写 prompt 是比较好的 prompt?
4.如果你需要生成一个广告或者摘要, 你怎么做让模型的字数尽可能少?
5.为什么你们的业务要用这个基座不用那个?
6.你用过那么多大模型,他们有啥区别?(就从激活函数 NORM prefixLM casualLM transformer 位置编码讲)
7. 你觉得先 NORM 和后 NORM 有啥优劣?
8. MHA 的计算时间复杂度是多少?和 FFN 哪个复杂度更高(感觉好像不太好直接比较啊)
手撕 MHA(其实我都没写好,面前看过代码,但是接口记不住,就随便写了个样子)
没写完呢就说可以了,面试官也没看
然后问:大模型训练常见的 loss 有哪些,写一下公司(写了交叉熵 KL 散度 PPO DPO 的 loss)
反问:你们推荐用到大模型吗?(目前还没有,业界主要还不用这个)
手撕 transformer mha
这个组做推荐业务的,也不设计大模型推荐,。。。所以感觉面试官也不知道问我啥
1.自我介绍
2.针对一个项目介绍
3.你觉得怎么写 prompt 是比较好的 prompt?
4.如果你需要生成一个广告或者摘要, 你怎么做让模型的字数尽可能少?
5.为什么你们的业务要用这个基座不用那个?
6.你用过那么多大模型,他们有啥区别?(就从激活函数 NORM prefixLM casualLM transformer 位置编码讲)
7. 你觉得先 NORM 和后 NORM 有啥优劣?
8. MHA 的计算时间复杂度是多少?和 FFN 哪个复杂度更高(感觉好像不太好直接比较啊)
手撕 MHA(其实我都没写好,面前看过代码,但是接口记不住,就随便写了个样子)
没写完呢就说可以了,面试官也没看
然后问:大模型训练常见的 loss 有哪些,写一下公司(写了交叉熵 KL 散度 PPO DPO 的 loss)
反问:你们推荐用到大模型吗?(目前还没有,业界主要还不用这个)
手撕 transformer mha
全部评论
北大佬啥方向都匹配
字节搜推技术太强了 换成llm不一定正向
兄弟二面没有手撕力扣吗
纳尼,现在业界不用大模型做推荐吗?我看到很多公司都用大模型做embedding啊
相关推荐
查看24道真题和解析 点赞 评论 收藏
分享
02-24 19:45
西南大学 后端工程师
程序员小白条:简历写的有点太多了,一般两页是实习经历比较多的情况下,要么自己有一些有影响力的开源项目,如果你走软件,硬件没必要实习,学校安排总是没区分度的,央国企最好有中大厂实习,另外学历比较重要,不是都要求硕士的,技术会比互联网要求低一些 点赞 评论 收藏
分享
