字节筋斗云机器学习工程师二面

很奇怪, 这种完全不匹配,还能过我到二面。。。
这个组做推荐业务的,也不设计大模型推荐,。。。所以感觉面试官也不知道问我啥
1.自我介绍
2.针对一个项目介绍
3.你觉得怎么写 prompt 是比较好的 prompt?
4.如果你需要生成一个广告或者摘要, 你怎么做让模型的字数尽可能少?
5.为什么你们的业务要用这个基座不用那个?
6.你用过那么多大模型,他们有啥区别?(就从激活函数 NORM prefixLM casualLM transformer 位置编码讲)
7. 你觉得先 NORM 和后 NORM 有啥优劣?
8. MHA 的计算时间复杂度是多少?和 FFN 哪个复杂度更高(感觉好像不太好直接比较啊)

手撕 MHA(其实我都没写好,面前看过代码,但是接口记不住,就随便写了个样子)
没写完呢就说可以了,面试官也没看
然后问:大模型训练常见的 loss 有哪些,写一下公司(写了交叉熵 KL 散度 PPO DPO 的 loss)

反问:你们推荐用到大模型吗?(目前还没有,业界主要还不用这个)

手撕 transformer mha
全部评论
北大佬啥方向都匹配
4 回复 分享
发布于 2024-08-26 16:38 上海
字节搜推技术太强了 换成llm不一定正向
3 回复 分享
发布于 2024-08-26 18:49 北京
兄弟二面没有手撕力扣吗
点赞 回复 分享
发布于 2024-08-29 11:39 四川
纳尼,现在业界不用大模型做推荐吗?我看到很多公司都用大模型做embedding啊
点赞 回复 分享
发布于 2024-08-26 17:44 山西

相关推荐

小时候觉得老师是很伟大的职业 感觉老师都是人中龙凤才能当 后来考入大学 发现以前的老同学也是公费师范生了 他们什么样什么人品 我还不清楚吗 只能希望他们以后也会有改变 要不纯属耽误孩子 实习之后发现 有的领导 能当上领导也可能运气成分很多 自己决策方面很差 分配给属下的东西自己也说不明白  前些年那些明星 各种塌房 少林寺大师都能有情人和孩子 越长大越发现世界就是个草台班子 以前对不懂的东西有一层羡慕的滤镜 接触之后发现就不是那回事了
RazerYang:其实也是幸存者偏差,你只关注草台班子的部分,所以觉得世界都是草台班子。实际上你每天能安全地从床上醒来,有稳定的天然气、自来水和电力供应,能让你吃上热乎的饭菜,能收到持续稳定的信号去刷手机,花几块钱就能坐地铁从城市的一端快速移动到另一端,花几百块就能在一天之内安全穿越整个国家,这都不是一个草台班子能实现的。燃气、水利、电力、通信、公交、民航,还有最重要的公安和国防,这些都不是草台班子能做的,有无数普通人构筑了你生活的方方面面,而你也将加入他们。
我对___祛魅了
点赞 评论 收藏
分享
评论
11
28
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务