字节搜推大模型实习面经 攒人品

1.主流的开源大模型结构有哪些?
2.介绍一下layernorm和batchnorm的区别?
3.在机器学习里,怎么处理长尾数据和多峰数据?
4.怎么解决模型的冷启动问题,你觉得LLM在冷启动方面能够起到什么作用?
5.介绍一下常见的优化算法优缺点
6.为什么Adam不一定最优而SGD最优的?怎么理解分析?
7.你工作里的对比损失是怎么构造的,有什么作用?介绍常见的对比损失的公式。
代码题:
数组第K大。给定整数数组 nums 和整数 k,请返回数组中第 k 个最大的元素。
全部评论
手撕这个太经典了
点赞 回复 分享
发布于 昨天 10:51 江西

相关推荐

昨天 14:06
已编辑
腾讯_IEG_后台开发实习生
查看4道真题和解析
点赞 评论 收藏
分享
评论
2
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务