字节国际广告算法二面面经

介绍部门业务,主要是广告算法
问倾向做偏研究性的还是业务性的算法岗
手撕1:  寻找有序数组中,target的出现次数,要求小于O(n)的时间复杂度
手撕2:查找数组第K小的元素 讨论实现思路
要求时间复杂度小于O(nlogn)
实习的LLM经历拷打
八股
如何增加模型泛化性?
归一化方式,layernorm和batchnorm的区别和计算方式,为什么要有归一化
Transformer架构中,TOKEN 间交互和TOKEN 内交互分别在那些模块中?
为什么基于attention的加权融合方式有效
全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务