首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
在学c语言的悲伤蛙很有气魄
门头沟学院 市场
发布于江苏
关注
已关注
取消关注
@RockyDing:
算法面试高频知识点:模型部署总结
----【模型部署】---- 【一】模型压缩的必要性与可行性? 模型压缩是指对算法模型进行精简,进而得到一个轻量且性能相当的小模型,压缩后的模型具有更小的结构和更少的参数,可以有效降低计算和存储开销,便于部署在端侧设备中。 随着AI技术的飞速发展,不管是移动端产品还是线上产品,进行AI赋能都成为了趋势。这种情况下,AI算法的实时性与减少内存占用都显得极为重要。AI模型的参数在一定程度上能够表达其复杂性,但并不是所有的参数都在模型中发挥作用,部分参数作用有限,表达冗余,甚至会降低模型的性能。 【二】X86和ARM架构在深度学习侧的区别? AI服务器与PC端一般都是使用X86架构,因为其高性能;AI端侧设备(手机/端侧盒子等)一般使用ARM架构,因为需要低功耗。 X86指令集中的指令是复杂的,一条很长指令就可以很多功能;而ARM指令集的指令是很精简的,需要几条精简的短指令完成很多功能。 X86的方向是高性能方向,因为它追求一条指令完成很多功能;而ARM的方向是面向低功耗,要求指令尽可能精简。 【三】FP32,FP16以及Int8的区别? 常规精度一般使用FP32(32位浮点,单精度)占用4个字节,共32位;低精度则使用FP16(半精度浮点)占用2个字节,共16位,INT8(8位的定点整数)八位整型,占用1个字节等。 混合精度(Mixed precision)指使用FP32和FP16。 使用FP16 可以减少模型一半内存,但有些参数必须采用FP32才能保持模型性能。 虽然INT8精度低,但是数据量小、能耗低,计算速度相对更快,更符合端侧运算的特点。 不同精度进行量化的归程中,量化误差不可避免。 在模型训练阶段,梯度的更新往往是很微小的,需要相对较高的精度,一般要用到FP32以上。在inference的阶段,精度要求没有那么高,一般F16或者INT8就足够了,精度影响不会很大。同时低精度的模型占用空间更小了,有利于部署在端侧设备中。 【四】GPU显存占用和GPU利用率的定义 GPU在训练时有两个重要指标可以查看,即显存占用和GPU利用率。 显存指的是GPU的空间,即内存大小。显存可以用来放模型,数据等。 GPU 利用率主要的统计方式为:在采样周期内,GPU 上有 kernel 执行的时间百分比。可以简单理解为GPU计算单元的使用率。 【五】神经网络的显存占用分析 Float32 是在深度学习中最常用的数值类型,称为单精度浮点数,每一个单精度浮点数占用4Byte的显存。 在整个神经网络训练周期中,在GPU上的显存占用主要包括:数据,模型参数,模型输出等。 数据侧:举个🌰,一个323128128的四维矩阵,其占用的显存 = 323128128*4 /1000 / 1000 = 6.3M 模型侧:占用显存的层包括卷积层,全连接层,BN层,梯度,优化器的参数等。 输出侧:占用的显存包括网络每一层计算出来的feature map以及对应的梯度等。 【六】影响模型inference速度的因素? FLOPs(模型总的加乘运算) MAC(内存访问成本) 并行度(模型inference时操作的并行度越高,速度越快) 计算平台(GPU,AI协处理器,CPU等) 【七】为何在AI端侧设备一般不使用传统图像算法? AI端侧设备多聚焦于深度学习算法模型的加速与赋能,而传统图像算法在没有加速算子赋能的情况下,在AI端侧设备无法发挥最优的性能。 【八】减小模型内存占用有哪些办法? 模型剪枝 模型蒸馏 模型量化 模型结构调整 【九】有哪些经典的轻量化网络? SqueezeNet MobileNet ShuffleNet Xception GhostNet 【十】模型参数计算? 首先,假设卷积核的尺寸是,有个特征图作为输入,每个输出的特征图大小为,输出为个特征图。 由于模型参数量主要由卷积,全连接层,BatchNorm层等部分组成,我们以卷积的参数量为例进行参数量的计算分析: 卷积核参数量: 偏置参数量: 总体参数量: 【十一】模型FLOPs怎么算? 同样,我们假设卷积核的尺寸是,有个特征图作为输入,每个输出的特征图大小为,输出为个特征图。 由于在模型中卷积一般占计算量的比重是最高的,我们依旧以卷积的计算量为例进行分析: FLOPS(全大写):是floating point operations per second的缩写,意指每秒浮点运算次数,理解为计算速度。是一个衡量硬件性能的指标。 FLOPs(s小写):是floating point operations的缩写(s表示复数),意指浮点运算数,理解为计算量。可以用来衡量算法/模型的复杂度。 针对模型的计算量应该指的是FLOPs。 在上述情况下,卷积神经网络一次前向传播需要的乘法运算次数为: 同时,所要进行的加法计算次数分为考虑偏置和不考虑偏置: (1)考虑偏置的情况: 为了得到输出的特征图的一个未知的像素,我们需要进行$K\times KK\times K - 1$次加法,由于有C个通道,所以需要将结果乘以C,每个通道间的数要相加,所以需要C - 1次加法,最后再加上偏置的1次加法。 所以总的加法计算量如下: 所以总的卷积运算计算量(乘法+加法): (2)不考虑偏置的情况: 总的卷积计算量:
点赞 23
评论 3
全部评论
推荐
最新
楼层
暂无评论,快来抢首评~
相关推荐
07-30 15:24
已编辑
门头沟学院 Java
我一上班就头疼
当初找实习的时候,总是对上班抱有幻想,觉得比学校里面开心多了,自己出去生活会更自由,现在我已经实习一个月了,每天都想觉得好累,最近代码一直被返工,原因是不够简洁,六点下班,五点半让我做代码优化,感觉生活都无光了。原本以为六点下班自己会自主学习,把之前的知识巩固再加强,结果是每天下班躺在床上连翻身都不翻,自己之前会背的八股现在也不会了,算法题也写不出来了,在小厂天天crud,唯一学会的是用stream。我感觉每个瞬间我都想跑路,但是还是得坚持,因为我觉得我现在回家也什么都不会学的。还是等9月份开学希望能找一个新的能双休的实习吧,单休太折磨人。最近想找一个新的项目替换简历上的项目,大家有什么推荐嘛...
点赞
评论
收藏
分享
07-29 20:28
中南大学 C++
研发岗和开发岗是一个意思吗?
今天给大家分享的是一位粉丝的提问,研发岗和开发岗是一个意思吗?接下来把粉丝的具体提问和我的回复分享给大家,希望也能给一些类似情况的小伙伴一些启发和帮助。同学提问:什么是研发岗?什么是开发岗?自研团队又是什么意思?Yt回答:讲一下这个研发岗和开发岗,这里跟有些公司它对于研发团队的定义是不一样的。因为有些公司是做产品的企业,所以它会叫做研发体系,你就比如华为内部它会叫研发岗,因为它们会有以产品为主这种出来,就包括像有些这种制造型企业,它也会有一个研发岗,它也会叫研发。其实研发的这个动作不单只是说代码研发,这里还包含硬件、包含模具、包含电源,都是属于研发体系的。那这里的开发就是development...
计算机就业职业规划辅导
点赞
评论
收藏
分享
07-02 19:53
广州软件学院 Java
究竟是谁在oc啊,好想死啊
26届,学院本(数据科学与大数据技术)现在依旧0实习,被动死了有无佬愿意拷打一下简历或者内推一下跪求跪谢
实习,投递多份简历没人回...
点赞
评论
收藏
分享
不愿透露姓名的神秘牛友
07-28 16:46
两段互联网实习,我开始祛魅了
第一段互联网实习结束🔚真的要做这个工作吗?是我的问题还是工作的问题?目前某中大厂实习中,感觉自己做的工作毫无价值毫无意义。。。秋招想跑路了,不想投互联网了感觉每个人都在为了一些看似有意义实则只是为了帮资本家圈用户钱的事情耗尽心情和精力
内向的柠檬精在研究求...:
事实上你秋招还是会选择冲大厂
我对___祛魅了
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
都是 dirty work,为什么别人的简历上就能言之有物🤔
2.7W
2
...
【07.29更新】能救一个是一个!26届毁意向毁约裁员黑名单
4408
3
...
干活最少的实习生因为长得漂亮转正了
3405
4
...
虾皮后端一面(已挂)
3262
5
...
26滴滴秋招提前批Java一面
3056
6
...
最近是各位大佬离职回去准备秋招了嘛,鼠鼠最近投的实习居然都有回应了,基本上当天投的两天之内都能有回应,要是秋招能有这样就太好了呜呜,简单记录一下吧。7月23日:快手-平台消费(一面)1.实习介绍(干了
2850
7
...
令人心动的offer!!!
2773
8
...
27双非百度offer timeline
2364
9
...
7.30滴滴提前批一面凉经
2269
10
...
QQ提前批一面凉经
2224
创作者周榜
更多
正在热议
更多
#
你遇到最难的面试题目是_
#
10980次浏览
133人参与
#
分享一个让你热爱工作的瞬间
#
32638次浏览
341人参与
#
中兴秋招
#
200044次浏览
2246人参与
#
工作中哪个瞬间让你想离职
#
55746次浏览
495人参与
#
工作压力大怎么缓解
#
94372次浏览
998人参与
#
你最讨厌面试问你什么?
#
19681次浏览
225人参与
#
26届的你,投了哪些公司?
#
28200次浏览
321人参与
#
多益网络求职进展汇总
#
31790次浏览
141人参与
#
我对___祛魅了
#
36695次浏览
342人参与
#
简历上的经历如何包装
#
16637次浏览
576人参与
#
你跟室友的关系怎么样?
#
5024次浏览
82人参与
#
第一份工作应该只看薪资吗
#
159052次浏览
1565人参与
#
如何快速融入团队?
#
13147次浏览
154人参与
#
和同事相处最忌讳的是__
#
17975次浏览
179人参与
#
leader认为你工作不认真怎么办
#
35020次浏览
163人参与
#
什么样的背景能拿SSP?
#
22271次浏览
153人参与
#
机械人的金三校招总结
#
35922次浏览
461人参与
#
饿了么求职进展汇总
#
64367次浏览
636人参与
#
打工人的精神状态
#
69367次浏览
1121人参与
#
我心目中的理想工作是这样的
#
72395次浏览
847人参与
#
百度秋招提前批进度
#
118233次浏览
1393人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务