快手-大模型算法应用工程师-二面
1.自我介绍
2.简历问答
3.问了一个根号dk的八股,flashattention,pageattention,给了一个7B模型的具体参数,以及存储形式,算训练过程的显存开销
4.代码:MHA
2.简历问答
3.问了一个根号dk的八股,flashattention,pageattention,给了一个7B模型的具体参数,以及存储形式,算训练过程的显存开销
4.代码:MHA
全部评论
同学,瞅瞅我司,医疗独角兽,我的主页最新动态,绿灯直达,免笔试~
您好,可以看一下我们公司,大厂供应链对外赋能平台,新成立的智能体业务部;
工作地点:北京/合肥/武汉/天津/上海/深圳等
免笔试
相关推荐
投票
点赞 评论 收藏
分享
快手成长空间 767人发布