首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
在学c语言的悲伤蛙很有气魄
门头沟学院 市场
发布于江苏
关注
已关注
取消关注
@RockyDing:
算法面试高频知识点:模型部署总结
----【模型部署】---- 【一】模型压缩的必要性与可行性? 模型压缩是指对算法模型进行精简,进而得到一个轻量且性能相当的小模型,压缩后的模型具有更小的结构和更少的参数,可以有效降低计算和存储开销,便于部署在端侧设备中。 随着AI技术的飞速发展,不管是移动端产品还是线上产品,进行AI赋能都成为了趋势。这种情况下,AI算法的实时性与减少内存占用都显得极为重要。AI模型的参数在一定程度上能够表达其复杂性,但并不是所有的参数都在模型中发挥作用,部分参数作用有限,表达冗余,甚至会降低模型的性能。 【二】X86和ARM架构在深度学习侧的区别? AI服务器与PC端一般都是使用X86架构,因为其高性能;AI端侧设备(手机/端侧盒子等)一般使用ARM架构,因为需要低功耗。 X86指令集中的指令是复杂的,一条很长指令就可以很多功能;而ARM指令集的指令是很精简的,需要几条精简的短指令完成很多功能。 X86的方向是高性能方向,因为它追求一条指令完成很多功能;而ARM的方向是面向低功耗,要求指令尽可能精简。 【三】FP32,FP16以及Int8的区别? 常规精度一般使用FP32(32位浮点,单精度)占用4个字节,共32位;低精度则使用FP16(半精度浮点)占用2个字节,共16位,INT8(8位的定点整数)八位整型,占用1个字节等。 混合精度(Mixed precision)指使用FP32和FP16。 使用FP16 可以减少模型一半内存,但有些参数必须采用FP32才能保持模型性能。 虽然INT8精度低,但是数据量小、能耗低,计算速度相对更快,更符合端侧运算的特点。 不同精度进行量化的归程中,量化误差不可避免。 在模型训练阶段,梯度的更新往往是很微小的,需要相对较高的精度,一般要用到FP32以上。在inference的阶段,精度要求没有那么高,一般F16或者INT8就足够了,精度影响不会很大。同时低精度的模型占用空间更小了,有利于部署在端侧设备中。 【四】GPU显存占用和GPU利用率的定义 GPU在训练时有两个重要指标可以查看,即显存占用和GPU利用率。 显存指的是GPU的空间,即内存大小。显存可以用来放模型,数据等。 GPU 利用率主要的统计方式为:在采样周期内,GPU 上有 kernel 执行的时间百分比。可以简单理解为GPU计算单元的使用率。 【五】神经网络的显存占用分析 Float32 是在深度学习中最常用的数值类型,称为单精度浮点数,每一个单精度浮点数占用4Byte的显存。 在整个神经网络训练周期中,在GPU上的显存占用主要包括:数据,模型参数,模型输出等。 数据侧:举个🌰,一个323128128的四维矩阵,其占用的显存 = 323128128*4 /1000 / 1000 = 6.3M 模型侧:占用显存的层包括卷积层,全连接层,BN层,梯度,优化器的参数等。 输出侧:占用的显存包括网络每一层计算出来的feature map以及对应的梯度等。 【六】影响模型inference速度的因素? FLOPs(模型总的加乘运算) MAC(内存访问成本) 并行度(模型inference时操作的并行度越高,速度越快) 计算平台(GPU,AI协处理器,CPU等) 【七】为何在AI端侧设备一般不使用传统图像算法? AI端侧设备多聚焦于深度学习算法模型的加速与赋能,而传统图像算法在没有加速算子赋能的情况下,在AI端侧设备无法发挥最优的性能。 【八】减小模型内存占用有哪些办法? 模型剪枝 模型蒸馏 模型量化 模型结构调整 【九】有哪些经典的轻量化网络? SqueezeNet MobileNet ShuffleNet Xception GhostNet 【十】模型参数计算? 首先,假设卷积核的尺寸是,有个特征图作为输入,每个输出的特征图大小为,输出为个特征图。 由于模型参数量主要由卷积,全连接层,BatchNorm层等部分组成,我们以卷积的参数量为例进行参数量的计算分析: 卷积核参数量: 偏置参数量: 总体参数量: 【十一】模型FLOPs怎么算? 同样,我们假设卷积核的尺寸是,有个特征图作为输入,每个输出的特征图大小为,输出为个特征图。 由于在模型中卷积一般占计算量的比重是最高的,我们依旧以卷积的计算量为例进行分析: FLOPS(全大写):是floating point operations per second的缩写,意指每秒浮点运算次数,理解为计算速度。是一个衡量硬件性能的指标。 FLOPs(s小写):是floating point operations的缩写(s表示复数),意指浮点运算数,理解为计算量。可以用来衡量算法/模型的复杂度。 针对模型的计算量应该指的是FLOPs。 在上述情况下,卷积神经网络一次前向传播需要的乘法运算次数为: 同时,所要进行的加法计算次数分为考虑偏置和不考虑偏置: (1)考虑偏置的情况: 为了得到输出的特征图的一个未知的像素,我们需要进行$K\times KK\times K - 1$次加法,由于有C个通道,所以需要将结果乘以C,每个通道间的数要相加,所以需要C - 1次加法,最后再加上偏置的1次加法。 所以总的加法计算量如下: 所以总的卷积运算计算量(乘法+加法): (2)不考虑偏置的情况: 总的卷积计算量:
点赞 24
评论 3
全部评论
推荐
最新
楼层
暂无评论,快来抢首评~
相关推荐
10-11 03:04
门头沟学院 Java
入职3个月.......
如题,校招入职了3个多月先细数过往吧哈哈,刚学那会恨不得将市面上所有技术都学一遍,vue、react 到 eletorn,从javase ssm springboot springcloud ,微服务、分布式,分库分表,redis、zookeeper、kafka、rocketmq、netty、rabbitmq、elasticsearch、docker、k8s,python hadoop hive hbase spark flink 机器学习 Linux。笔面试准备,代码随想录、小林coding、javaguide、王道考研。看过的书 23种设计模式 4天玩转docker java并...
我的求职思考
点赞
评论
收藏
分享
10-10 17:06
天津大学 研发工程师
分享一个很友好的公司
我弟也是26届的,刚好最近也在准备秋招。工作之后,好久没有这样长篇大论的和他聊天、去分析一件事情了。今天又打开聊天框,思绪回到了几年前我准备秋招的时候。太早独立的我习惯了一切都是自己做决定,都是自己摸索着走了过来。工作了几年后,对着他似乎看到了那时的自己,和他说了蛮多的,索性,想和正在秋招的同学也分享一下。首先,就我在的行业,替大家来一个每日一问:应届生选择制造业,还香吗?还值得冲吗?我的观察不知道大家有没有同感,最近这几年的就业市场,真的在悄悄发生一些挺深刻的变化(一种暗流涌动的感觉)。以前大家挤破头想进的万人互联网大厂,现在人才进出的比例明显在放缓,不过,不关注这个的同学确实不会注意到这个...
赛百味资深测评博主:
请问秋招开了吗?
爱玛科技成长空间 4人发布
点赞
评论
收藏
分享
09-29 10:48
合肥师范学院 Java
这个必须得挂
秋招找不着,去投实习,这个问题属实难绷
程序员小白条:
《鉴定为招数学系》
点赞
评论
收藏
分享
09-17 12:00
北京交通大学 后端工程师
秋招结束了
双非本像是有案底
ResourceUt...:
楼主有自己的垃圾箱,公司也有自己的人才库
点赞
评论
收藏
分享
10-11 23:23
已编辑
深圳大学 Java
招银网络一面
全程大概半小时,没有手撕环节苦苦回忆一番,记得几个印象比较深的问题(1)MySQL binlog主从复制流程,binlog格式(2)MySQL 为什么使用B+树作为索引,而非B树、红黑树(3)MySQL 优化(优化表结构、优化SQL语句、建立索引、使用时避免索引失效、架构上可以考虑使用主从 & 冷热表分离)(4)Redis 实现分布式锁要考虑?(使用原子命令setnx、设置过期时间、给分布式锁设置标识、使用lua脚本释放锁)(5)Redis 和 ZooKeeper 实现分布式锁的异同,适用场景(AP、CP)(6)Redis 集群模式(7)RocketMQ 深挖(broker架构、bro...
查看7道真题和解析
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
除了卷大厂,还有其他出路吗?
4087
2
...
懂车帝二面 2025.10.11 1h32min
3519
3
...
小红书一面面经
2509
4
...
双非秋招大厂time line参考
2413
5
...
牛牛求救🆘,不敢梭哈后端第二技能点怎么搭配
2043
6
...
第一次去很远的地方实习很不安,大家有这种感觉吗
1910
7
...
最近面试回答不出来的题
1891
8
...
27届速通第一段前端实习后续--节孝子启动!
1814
9
...
10.12pdd笔试大鸭蛋
1561
10
...
校招谈薪一定要知道的事
1526
创作者周榜
更多
正在热议
更多
#
找工作中的小确幸
#
3974次浏览
35人参与
#
机械求职避坑tips
#
66894次浏览
448人参与
#
爱玛科技集团求职进展汇总
#
28714次浏览
203人参与
#
面包vs爱情,怎么选?
#
13578次浏览
151人参与
#
秋招踩过的“雷”,希望你别再踩
#
8452次浏览
60人参与
#
发面经攒人品
#
2309071次浏览
32249人参与
#
深信服秋招来了
#
280220次浏览
2917人参与
#
实习下班不想学习,正常吗?
#
1339次浏览
24人参与
#
机械人值得去的小众企业
#
23974次浏览
54人参与
#
贝壳求职进展汇总
#
35459次浏览
196人参与
#
校招谈薪一定要知道的事
#
1421次浏览
26人参与
#
秋招结束之后的日子
#
87313次浏览
985人参与
#
投格力的你,拿到offer了吗?
#
118701次浏览
686人参与
#
你觉得什么岗位会被AI替代
#
2684次浏览
50人参与
#
浪潮求职进展汇总
#
17544次浏览
137人参与
#
新凯来求职进展汇总
#
51033次浏览
131人参与
#
职场新人体验
#
86066次浏览
610人参与
#
机械制造面试点评
#
71989次浏览
452人参与
#
招银网络求职进展汇总
#
171213次浏览
997人参与
#
面试被问“你的缺点是什么?”怎么答
#
155688次浏览
2204人参与
#
Offer比较,你最看重什么?
#
215978次浏览
1391人参与
#
硬件/芯片公司岗位评价
#
8647次浏览
29人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务