首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
在学c语言的悲伤蛙很有气魄
门头沟学院 市场
发布于江苏
关注
已关注
取消关注
@RockyDing:
算法面试高频知识点:模型部署总结
----【模型部署】---- 【一】模型压缩的必要性与可行性? 模型压缩是指对算法模型进行精简,进而得到一个轻量且性能相当的小模型,压缩后的模型具有更小的结构和更少的参数,可以有效降低计算和存储开销,便于部署在端侧设备中。 随着AI技术的飞速发展,不管是移动端产品还是线上产品,进行AI赋能都成为了趋势。这种情况下,AI算法的实时性与减少内存占用都显得极为重要。AI模型的参数在一定程度上能够表达其复杂性,但并不是所有的参数都在模型中发挥作用,部分参数作用有限,表达冗余,甚至会降低模型的性能。 【二】X86和ARM架构在深度学习侧的区别? AI服务器与PC端一般都是使用X86架构,因为其高性能;AI端侧设备(手机/端侧盒子等)一般使用ARM架构,因为需要低功耗。 X86指令集中的指令是复杂的,一条很长指令就可以很多功能;而ARM指令集的指令是很精简的,需要几条精简的短指令完成很多功能。 X86的方向是高性能方向,因为它追求一条指令完成很多功能;而ARM的方向是面向低功耗,要求指令尽可能精简。 【三】FP32,FP16以及Int8的区别? 常规精度一般使用FP32(32位浮点,单精度)占用4个字节,共32位;低精度则使用FP16(半精度浮点)占用2个字节,共16位,INT8(8位的定点整数)八位整型,占用1个字节等。 混合精度(Mixed precision)指使用FP32和FP16。 使用FP16 可以减少模型一半内存,但有些参数必须采用FP32才能保持模型性能。 虽然INT8精度低,但是数据量小、能耗低,计算速度相对更快,更符合端侧运算的特点。 不同精度进行量化的归程中,量化误差不可避免。 在模型训练阶段,梯度的更新往往是很微小的,需要相对较高的精度,一般要用到FP32以上。在inference的阶段,精度要求没有那么高,一般F16或者INT8就足够了,精度影响不会很大。同时低精度的模型占用空间更小了,有利于部署在端侧设备中。 【四】GPU显存占用和GPU利用率的定义 GPU在训练时有两个重要指标可以查看,即显存占用和GPU利用率。 显存指的是GPU的空间,即内存大小。显存可以用来放模型,数据等。 GPU 利用率主要的统计方式为:在采样周期内,GPU 上有 kernel 执行的时间百分比。可以简单理解为GPU计算单元的使用率。 【五】神经网络的显存占用分析 Float32 是在深度学习中最常用的数值类型,称为单精度浮点数,每一个单精度浮点数占用4Byte的显存。 在整个神经网络训练周期中,在GPU上的显存占用主要包括:数据,模型参数,模型输出等。 数据侧:举个🌰,一个323128128的四维矩阵,其占用的显存 = 323128128*4 /1000 / 1000 = 6.3M 模型侧:占用显存的层包括卷积层,全连接层,BN层,梯度,优化器的参数等。 输出侧:占用的显存包括网络每一层计算出来的feature map以及对应的梯度等。 【六】影响模型inference速度的因素? FLOPs(模型总的加乘运算) MAC(内存访问成本) 并行度(模型inference时操作的并行度越高,速度越快) 计算平台(GPU,AI协处理器,CPU等) 【七】为何在AI端侧设备一般不使用传统图像算法? AI端侧设备多聚焦于深度学习算法模型的加速与赋能,而传统图像算法在没有加速算子赋能的情况下,在AI端侧设备无法发挥最优的性能。 【八】减小模型内存占用有哪些办法? 模型剪枝 模型蒸馏 模型量化 模型结构调整 【九】有哪些经典的轻量化网络? SqueezeNet MobileNet ShuffleNet Xception GhostNet 【十】模型参数计算? 首先,假设卷积核的尺寸是,有个特征图作为输入,每个输出的特征图大小为,输出为个特征图。 由于模型参数量主要由卷积,全连接层,BatchNorm层等部分组成,我们以卷积的参数量为例进行参数量的计算分析: 卷积核参数量: 偏置参数量: 总体参数量: 【十一】模型FLOPs怎么算? 同样,我们假设卷积核的尺寸是,有个特征图作为输入,每个输出的特征图大小为,输出为个特征图。 由于在模型中卷积一般占计算量的比重是最高的,我们依旧以卷积的计算量为例进行分析: FLOPS(全大写):是floating point operations per second的缩写,意指每秒浮点运算次数,理解为计算速度。是一个衡量硬件性能的指标。 FLOPs(s小写):是floating point operations的缩写(s表示复数),意指浮点运算数,理解为计算量。可以用来衡量算法/模型的复杂度。 针对模型的计算量应该指的是FLOPs。 在上述情况下,卷积神经网络一次前向传播需要的乘法运算次数为: 同时,所要进行的加法计算次数分为考虑偏置和不考虑偏置: (1)考虑偏置的情况: 为了得到输出的特征图的一个未知的像素,我们需要进行$K\times KK\times K - 1$次加法,由于有C个通道,所以需要将结果乘以C,每个通道间的数要相加,所以需要C - 1次加法,最后再加上偏置的1次加法。 所以总的加法计算量如下: 所以总的卷积运算计算量(乘法+加法): (2)不考虑偏置的情况: 总的卷积计算量:
点赞 24
评论 3
全部评论
推荐
最新
楼层
暂无评论,快来抢首评~
相关推荐
12-09 15:30
门头沟学院 Java
成都java小厂 日常实习一面面经 25min
面试官很好,很温柔1.自我介绍2.集合有哪些3.ArrayList和LinkedList的区别4.set和ArrayList的区别5.set的底层6.hashmap的底层7.jmm8.为什么要用redis9.用redis主要干什么10.reids过期策略11.惰性删除有什么问题12.定时删除为啥不把key全部扫描一遍,要只扫描一部分13.redis持久化机制14.redis淘汰策略15.redis zset 结合项目介绍16.kafka顺序消费17.单例模式18.工厂模式19.策略模式20.常用的linux命令21.反问算法:算术平方根(保留整数)中序遍历二叉树
查看22道真题和解析
点赞
评论
收藏
分享
12-13 12:48
门头沟学院 机械结构工程师
2026届机械秋招投递记录6-梅特勒托利多
1-机械工程师-常州 6.6投递-10.9笔试(线下)-10.10一面(线下)-寄线下笔试花了一下午时间,前期一点半开始宣讲,全是虚假宣传,个人崇拜(抽奖礼物是送他们中国区总裁的签名书一本??????),浪费时间,一个套壳的假私企面试时候也很不尊重人,有一个类似男人婆的小斜眼的妇女很恶心人,面试完后如果对你不满意就直接走人。全是关系户,在外面候场时候,听到HR说:“这是XX(211)学校的硕士,x总家的亲戚,让咱们照顾一下,这个孩子很优秀。”笑死人了,现场还是有很多9硕和双9硕的,“Ta”就优秀了已经。大家避雷这个公司!!!!!!!!!!!自我介绍奖学金,排名,专业硕士项目1介绍硕士项目2介绍...
2026届机械秋招投递记...
点赞
评论
收藏
分享
11-17 18:24
哈尔滨工业大学 数据分析师
9本简历
能找到大厂实习吗
点赞
评论
收藏
分享
11-17 12:19
重庆理工大学 嵌入式软件工程师
双非本科0offer
秋招面了十几家,结果十几家全跪。笔试,技术面都过了,结果hr面听我挂过科直接给我拒了😭
淬月星辉:
专利是什么?至少描述一下吧,然后把什么计算机二级、普通话这种拉低格调的证书删掉,不然hr以为你没东西写
点赞
评论
收藏
分享
昨天 20:20
已编辑
门头沟学院 Java
实习转正被关系户搞,我是大冤种
找暑假实习本来就不容易,我好不容易闯过一面二面,HR 当时还明确说转正名额充足,我心里一下子踏实了,想着好好表现,把这个 offer 当成秋招的保底。实习期间,我一直认认真真完成MT和 leader 交代的任务。临近实习末期,有个管理招聘的同事在周五下午快下班了的时候,说最近要评转正实习生,让我们实习生最近总结好自己的产出,形成实习报告,也没说什么时候截止,当时我觉得可能就是提个醒,没太注意,打算下周一再准备,好好总结一下。等到下周一上午一上班,那个正职同事突然说,今天中午前就得交实习报告了,就剩两三个小时,我赶紧把最近写的代码,文档什么的都好好总结一下,mt也帮我好好检查一下我的报告,查缺补...
工作中遇到的歹人
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
别等了,渣男不会为了你离婚的!
5387
2
...
爱情?事业?应作如是观
5168
3
...
双非鼠鼠秋招有感
4518
4
...
28届到底选什么方向合适
3501
5
...
27前端要不要寒假找实习
3054
6
...
签下三方时我没有任何情绪波动,继续努力向前行
2858
7
...
字节26校招前端一面
1927
8
...
求助,老丈人终面如何准备
1875
9
...
一直说我工作不饱和的+2歹人
1652
10
...
选择校招/实习Offer的逻辑
1527
创作者周榜
更多
正在热议
更多
#
摸鱼被leader发现了怎么办
#
74002次浏览
421人参与
#
工作后明白的那些道理
#
30526次浏览
339人参与
#
工作后,你落下了哪些病根
#
1427次浏览
33人参与
#
电网求职进展汇总
#
33427次浏览
90人参与
#
你学到的“最没用”的职场技能是
#
1331次浏览
28人参与
#
七夕节你打算怎么过?
#
70085次浏览
806人参与
#
业务面应该做哪些准备
#
80565次浏览
831人参与
#
国央企笔面经互助
#
172473次浏览
1211人参与
#
你见过最离谱的招聘要求是什么?
#
245538次浏览
1691人参与
#
满帮集团求职进展汇总
#
13287次浏览
95人参与
#
拼多多求职进展汇总
#
798279次浏览
6452人参与
#
上班到公司第一件事做什么?
#
113934次浏览
787人参与
#
职场破防瞬间
#
352689次浏览
2827人参与
#
工作两年想退休了
#
208284次浏览
1844人参与
#
硬件人秋招的第一个offer
#
111144次浏览
1426人参与
#
国企/银行/研究所公司爆料
#
177682次浏览
889人参与
#
视觉/交互/设计招聘信息汇总
#
24425次浏览
634人参与
#
产品人求职现状
#
299198次浏览
2363人参与
#
如果可以选,你最想从事什么工作
#
672392次浏览
4848人参与
#
满分简历要如何准备?
#
249614次浏览
2961人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务