首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
在学c语言的悲伤蛙很有气魄
门头沟学院 市场
发布于江苏
关注
已关注
取消关注
@RockyDing:
算法面试高频知识点:模型部署总结
----【模型部署】---- 【一】模型压缩的必要性与可行性? 模型压缩是指对算法模型进行精简,进而得到一个轻量且性能相当的小模型,压缩后的模型具有更小的结构和更少的参数,可以有效降低计算和存储开销,便于部署在端侧设备中。 随着AI技术的飞速发展,不管是移动端产品还是线上产品,进行AI赋能都成为了趋势。这种情况下,AI算法的实时性与减少内存占用都显得极为重要。AI模型的参数在一定程度上能够表达其复杂性,但并不是所有的参数都在模型中发挥作用,部分参数作用有限,表达冗余,甚至会降低模型的性能。 【二】X86和ARM架构在深度学习侧的区别? AI服务器与PC端一般都是使用X86架构,因为其高性能;AI端侧设备(手机/端侧盒子等)一般使用ARM架构,因为需要低功耗。 X86指令集中的指令是复杂的,一条很长指令就可以很多功能;而ARM指令集的指令是很精简的,需要几条精简的短指令完成很多功能。 X86的方向是高性能方向,因为它追求一条指令完成很多功能;而ARM的方向是面向低功耗,要求指令尽可能精简。 【三】FP32,FP16以及Int8的区别? 常规精度一般使用FP32(32位浮点,单精度)占用4个字节,共32位;低精度则使用FP16(半精度浮点)占用2个字节,共16位,INT8(8位的定点整数)八位整型,占用1个字节等。 混合精度(Mixed precision)指使用FP32和FP16。 使用FP16 可以减少模型一半内存,但有些参数必须采用FP32才能保持模型性能。 虽然INT8精度低,但是数据量小、能耗低,计算速度相对更快,更符合端侧运算的特点。 不同精度进行量化的归程中,量化误差不可避免。 在模型训练阶段,梯度的更新往往是很微小的,需要相对较高的精度,一般要用到FP32以上。在inference的阶段,精度要求没有那么高,一般F16或者INT8就足够了,精度影响不会很大。同时低精度的模型占用空间更小了,有利于部署在端侧设备中。 【四】GPU显存占用和GPU利用率的定义 GPU在训练时有两个重要指标可以查看,即显存占用和GPU利用率。 显存指的是GPU的空间,即内存大小。显存可以用来放模型,数据等。 GPU 利用率主要的统计方式为:在采样周期内,GPU 上有 kernel 执行的时间百分比。可以简单理解为GPU计算单元的使用率。 【五】神经网络的显存占用分析 Float32 是在深度学习中最常用的数值类型,称为单精度浮点数,每一个单精度浮点数占用4Byte的显存。 在整个神经网络训练周期中,在GPU上的显存占用主要包括:数据,模型参数,模型输出等。 数据侧:举个🌰,一个323128128的四维矩阵,其占用的显存 = 323128128*4 /1000 / 1000 = 6.3M 模型侧:占用显存的层包括卷积层,全连接层,BN层,梯度,优化器的参数等。 输出侧:占用的显存包括网络每一层计算出来的feature map以及对应的梯度等。 【六】影响模型inference速度的因素? FLOPs(模型总的加乘运算) MAC(内存访问成本) 并行度(模型inference时操作的并行度越高,速度越快) 计算平台(GPU,AI协处理器,CPU等) 【七】为何在AI端侧设备一般不使用传统图像算法? AI端侧设备多聚焦于深度学习算法模型的加速与赋能,而传统图像算法在没有加速算子赋能的情况下,在AI端侧设备无法发挥最优的性能。 【八】减小模型内存占用有哪些办法? 模型剪枝 模型蒸馏 模型量化 模型结构调整 【九】有哪些经典的轻量化网络? SqueezeNet MobileNet ShuffleNet Xception GhostNet 【十】模型参数计算? 首先,假设卷积核的尺寸是,有个特征图作为输入,每个输出的特征图大小为,输出为个特征图。 由于模型参数量主要由卷积,全连接层,BatchNorm层等部分组成,我们以卷积的参数量为例进行参数量的计算分析: 卷积核参数量: 偏置参数量: 总体参数量: 【十一】模型FLOPs怎么算? 同样,我们假设卷积核的尺寸是,有个特征图作为输入,每个输出的特征图大小为,输出为个特征图。 由于在模型中卷积一般占计算量的比重是最高的,我们依旧以卷积的计算量为例进行分析: FLOPS(全大写):是floating point operations per second的缩写,意指每秒浮点运算次数,理解为计算速度。是一个衡量硬件性能的指标。 FLOPs(s小写):是floating point operations的缩写(s表示复数),意指浮点运算数,理解为计算量。可以用来衡量算法/模型的复杂度。 针对模型的计算量应该指的是FLOPs。 在上述情况下,卷积神经网络一次前向传播需要的乘法运算次数为: 同时,所要进行的加法计算次数分为考虑偏置和不考虑偏置: (1)考虑偏置的情况: 为了得到输出的特征图的一个未知的像素,我们需要进行$K\times KK\times K - 1$次加法,由于有C个通道,所以需要将结果乘以C,每个通道间的数要相加,所以需要C - 1次加法,最后再加上偏置的1次加法。 所以总的加法计算量如下: 所以总的卷积运算计算量(乘法+加法): (2)不考虑偏置的情况: 总的卷积计算量:
点赞 24
评论 4
全部评论
推荐
最新
楼层
暂无评论,快来抢首评~
相关推荐
05-05 20:30
中国矿业大学(北京) Web前端
秋招倒计时:30天从零到一拿下前端实习(附完整冲刺路线)
最近不少学前端的都有提到说,发现今年秋招前端的竞争已经不止卷八股和项目了——“AI 全栈”这个词开始出现在前端 JD 里。很多岗位可能还会明确写“了解大模型应用、Agent 开发优先”,哪怕你是投前端实习。于是就出现了一个尴尬的现状:传统前端路线还在让你慢慢啃 HTML/CSS/JS,做完一个后台管理系统就去面试。但另一边,企业已经开始期待你能聊一聊 Agent、流式响应、工具调用。很多人其实也不是不想学,就是不知道怎么把 AI 项目和前端实习路线揉在一起,又不影响基础学习节奏。所以我趁着放假梳理了一份 30 天“传统前端 + AI Agent”双项目冲刺路线,给秋招前想刷一段前端实习的同学参...
前端面试准备&技...
点赞
评论
收藏
分享
05-04 11:54
中南大学 Java
互联网大厂是不是可以玩献祭流?
听说部分互联网厂的员工在工位上猝死可得5倍年薪赔偿? 我发现互联网还有献祭流这种玩法啊。假如生命只剩5小时,我建议4个小陪伴父母,半小时自己去买点好吃的,剩下半小时直接打开mac开始办公。来吧,互联网职业生涯的最后一舞! 互联网这个版本的强度还是太超标了啊! 至于为什么会猝死你别管。#牛客AI配图神器#
Java抽象小篮子:
你互联网叔叔这版本这么超标,不削能玩?
互联网公司评价
点赞
评论
收藏
分享
03-26 16:11
已编辑
门头沟学院 Java
28小登简历求拷打
简历是过年做好的(第三版),boss 上沟通了 142 个,只有 13 个要了简历,0 个面试要不要换 agent 项目呀,现在就是很纠结,看到后端太卷了又想去测开,但是 0 基础,只会 apifox 接口测试,有没有大佬指导指导,面试机会少,经验也少,还在纠结要不要去报个面试辅导...如今 ai 这么火,天天焦虑的很😮💨要不然暑期实习都找不到了
F1shLu0:
你这个简历太长了,而且字很密。看一眼就不想看了。
点赞
评论
收藏
分享
04-27 19:35
萍乡学院 后端工程师
28届学院本,求大佬锐评简历。
这两个项目都是自己vibe coding出来的,简历是AI生成优化的,其中还有很多东西是不懂的。求大佬指点🙏🥹
点赞
评论
收藏
分享
05-05 19:43
门头沟学院 Java
大一开始卷?卷一个,还不如多睡会觉
今天刷到一个帖子,大一新生问怎么进大厂,底下的回答全是“现在就要开始卷实习了” “ACM金牌是必须的” “项目经历不能少”。 我差点没蚌住。 啥时候大一起跑线就画到这儿了?我大一的时候,还在研究怎么翘掉晚自习。 没错,就是去社团工位上摸鱼。 我当初进那个融媒体社团,面试就是个巨大的草台班子。我说我以前在破站做UP主,有个几千粉丝,学长就点点头,“噢,挺好的,录了。” 就这么简单。 进去之后呢?学长扔下一句“软件自己回去装,教程自己找”,就结束了。我当时就悟了:大学=自学,完美的诠释。 这绝对是我大学第一课。 不过,社团也不是一无是处,它给我最大的好处就是——一个合法逃掉晚自习的工位。高中的晚自...
大学四年该怎么过,才不算...
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
毕业了,有些话只能藏在心里了
1.9W
2
...
毕业啦!我们要一起去广州打拼啦!
1.9W
3
...
2026春招到底卷成什么样了?填问卷说出真相,最高领200元现金红包
1.5W
4
...
字节 中国交易与广告 后端一面
1.2W
5
...
211本,130投0面,agent应用开发,简历求助!
7932
6
...
从阿里被裁到快手升P6,我花了四年
7648
7
...
华为暑期实习
7157
8
...
从腾讯到阿里感,谢一路走来的自己
6548
9
...
别人:阿里 字节 腾讯
6520
10
...
在携程的一天
6384
创作者周榜
更多
正在热议
更多
#
这个offer值得去吗?
#
31072次浏览
226人参与
#
校招薪资来揭秘
#
960337次浏览
4061人参与
#
联宝杯大学生创新大赛,你的技术值得产业级答案
#
50648次浏览
781人参与
#
如果春招能重来,我会___
#
29088次浏览
288人参与
#
24秋招避雷总结
#
1019791次浏览
7098人参与
#
你会因为行情,降低找工作标准吗?
#
44717次浏览
326人参与
#
在爱玛,骑向未来
#
20114次浏览
394人参与
#
机械人还在等华为开奖吗?
#
339145次浏览
1652人参与
#
米哈游求职进展汇总
#
688516次浏览
3348人参与
#
华为池子有多大
#
177958次浏览
931人参与
#
26届春招投递记录
#
8590次浏览
71人参与
#
通信/硬件求职避坑tips
#
171964次浏览
1170人参与
#
25届网易互娱暑实进度
#
109055次浏览
802人参与
#
记录我的毕业季
#
4422次浏览
116人参与
#
机械人,你的秋招第一份简历被谁挂了
#
268708次浏览
2450人参与
#
远程面试的尴尬瞬间
#
363758次浏览
2062人参与
#
大学最后一个寒假,我想……
#
103264次浏览
846人参与
#
机械求职避坑tips
#
103639次浏览
589人参与
#
你认为小厂实习有用吗?
#
144999次浏览
762人参与
#
网易求职进展汇总
#
213088次浏览
1523人参与
#
美团秋招笔试
#
216268次浏览
1191人参与
#
刚入职就____,这样正常吗?
#
148957次浏览
709人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务