首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
在学c语言的悲伤蛙很有气魄
门头沟学院 市场
发布于江苏
关注
已关注
取消关注
@RockyDing:
算法面试高频知识点:模型部署总结
----【模型部署】---- 【一】模型压缩的必要性与可行性? 模型压缩是指对算法模型进行精简,进而得到一个轻量且性能相当的小模型,压缩后的模型具有更小的结构和更少的参数,可以有效降低计算和存储开销,便于部署在端侧设备中。 随着AI技术的飞速发展,不管是移动端产品还是线上产品,进行AI赋能都成为了趋势。这种情况下,AI算法的实时性与减少内存占用都显得极为重要。AI模型的参数在一定程度上能够表达其复杂性,但并不是所有的参数都在模型中发挥作用,部分参数作用有限,表达冗余,甚至会降低模型的性能。 【二】X86和ARM架构在深度学习侧的区别? AI服务器与PC端一般都是使用X86架构,因为其高性能;AI端侧设备(手机/端侧盒子等)一般使用ARM架构,因为需要低功耗。 X86指令集中的指令是复杂的,一条很长指令就可以很多功能;而ARM指令集的指令是很精简的,需要几条精简的短指令完成很多功能。 X86的方向是高性能方向,因为它追求一条指令完成很多功能;而ARM的方向是面向低功耗,要求指令尽可能精简。 【三】FP32,FP16以及Int8的区别? 常规精度一般使用FP32(32位浮点,单精度)占用4个字节,共32位;低精度则使用FP16(半精度浮点)占用2个字节,共16位,INT8(8位的定点整数)八位整型,占用1个字节等。 混合精度(Mixed precision)指使用FP32和FP16。 使用FP16 可以减少模型一半内存,但有些参数必须采用FP32才能保持模型性能。 虽然INT8精度低,但是数据量小、能耗低,计算速度相对更快,更符合端侧运算的特点。 不同精度进行量化的归程中,量化误差不可避免。 在模型训练阶段,梯度的更新往往是很微小的,需要相对较高的精度,一般要用到FP32以上。在inference的阶段,精度要求没有那么高,一般F16或者INT8就足够了,精度影响不会很大。同时低精度的模型占用空间更小了,有利于部署在端侧设备中。 【四】GPU显存占用和GPU利用率的定义 GPU在训练时有两个重要指标可以查看,即显存占用和GPU利用率。 显存指的是GPU的空间,即内存大小。显存可以用来放模型,数据等。 GPU 利用率主要的统计方式为:在采样周期内,GPU 上有 kernel 执行的时间百分比。可以简单理解为GPU计算单元的使用率。 【五】神经网络的显存占用分析 Float32 是在深度学习中最常用的数值类型,称为单精度浮点数,每一个单精度浮点数占用4Byte的显存。 在整个神经网络训练周期中,在GPU上的显存占用主要包括:数据,模型参数,模型输出等。 数据侧:举个🌰,一个323128128的四维矩阵,其占用的显存 = 323128128*4 /1000 / 1000 = 6.3M 模型侧:占用显存的层包括卷积层,全连接层,BN层,梯度,优化器的参数等。 输出侧:占用的显存包括网络每一层计算出来的feature map以及对应的梯度等。 【六】影响模型inference速度的因素? FLOPs(模型总的加乘运算) MAC(内存访问成本) 并行度(模型inference时操作的并行度越高,速度越快) 计算平台(GPU,AI协处理器,CPU等) 【七】为何在AI端侧设备一般不使用传统图像算法? AI端侧设备多聚焦于深度学习算法模型的加速与赋能,而传统图像算法在没有加速算子赋能的情况下,在AI端侧设备无法发挥最优的性能。 【八】减小模型内存占用有哪些办法? 模型剪枝 模型蒸馏 模型量化 模型结构调整 【九】有哪些经典的轻量化网络? SqueezeNet MobileNet ShuffleNet Xception GhostNet 【十】模型参数计算? 首先,假设卷积核的尺寸是,有个特征图作为输入,每个输出的特征图大小为,输出为个特征图。 由于模型参数量主要由卷积,全连接层,BatchNorm层等部分组成,我们以卷积的参数量为例进行参数量的计算分析: 卷积核参数量: 偏置参数量: 总体参数量: 【十一】模型FLOPs怎么算? 同样,我们假设卷积核的尺寸是,有个特征图作为输入,每个输出的特征图大小为,输出为个特征图。 由于在模型中卷积一般占计算量的比重是最高的,我们依旧以卷积的计算量为例进行分析: FLOPS(全大写):是floating point operations per second的缩写,意指每秒浮点运算次数,理解为计算速度。是一个衡量硬件性能的指标。 FLOPs(s小写):是floating point operations的缩写(s表示复数),意指浮点运算数,理解为计算量。可以用来衡量算法/模型的复杂度。 针对模型的计算量应该指的是FLOPs。 在上述情况下,卷积神经网络一次前向传播需要的乘法运算次数为: 同时,所要进行的加法计算次数分为考虑偏置和不考虑偏置: (1)考虑偏置的情况: 为了得到输出的特征图的一个未知的像素,我们需要进行$K\times KK\times K - 1$次加法,由于有C个通道,所以需要将结果乘以C,每个通道间的数要相加,所以需要C - 1次加法,最后再加上偏置的1次加法。 所以总的加法计算量如下: 所以总的卷积运算计算量(乘法+加法): (2)不考虑偏置的情况: 总的卷积计算量:
点赞 24
评论 3
全部评论
推荐
最新
楼层
暂无评论,快来抢首评~
相关推荐
昨天 11:45
东莞理工学院 Java
致远互联Java一面
1、自我介绍2、了解过Spring MVC吗3、线程安全问题4、你用过什么锁5、AOP切面类6、数据库分库分表7、MySQL优化8、Linux中查询/结束进程的指令9、场景题(忘记了,答得有点烂)10、没有寿司算法(服了)11、更偏向二次开发还是0-112、注重业务还是代码13、项目拷打反问14、技术栈(微服务,比较底层的代码,偏业务)#牛客AI配图神器#
查看11道真题和解析
点赞
评论
收藏
分享
01-28 12:20
联想(北京)有限公司_后端开发部_JAVA开发工程师(准入职员工)
莉莉丝内推,莉莉丝内推码
莉莉丝游戏数据分析师的面试经验:面试流程与内容:面试通常包含自我介绍、针对实习和项目经历的深入提问、业务指标体系及思路的考察、数据处理和分析能力的评估等环节。具体可能包括A/Btest的配置流程、样本量计算、功能上线后的指标监控方式和具体指标等。游戏相关知识:面试官会询问应聘者平时玩的游戏、对特定游戏的看法,以及游戏内重要数据的识别和分析,如流失原因、付费表现影响因素等。综合能力与岗位匹配度:面试还会考察应聘者的优势、最近一年的目标及其为实现目标所做的努力,以及对游戏领域市场动态的了解等,以评估其与岗位的匹配度和潜力。 莉莉丝游戏2026校招补招启...
点赞
评论
收藏
分享
2025-12-22 15:04
江西农业大学 Web前端
为什么我27届不行,你们是怎么投的?
SaviorSu:
直接说下学期可以请假,一般情况学校允许
我26届,大三就直接去实习了
点赞
评论
收藏
分享
2025-12-09 10:31
湖南大学 安卓
“30k以上再来找我”
感觉已经被boss围攻了,点进去直接爆了,我一个一个来整顿,职场的风气是时候该换一换了,正本清源从我做起hr还急急急,这么急还开的10-12k,还是税前工资,服了。直接巨发简历,表明态度!
前程似锦的莲雾很用心:
干的漂亮兄弟
0经验如何找实习?
点赞
评论
收藏
分享
01-31 15:08
浙江大学 算法工程师
C++面试八股文(Qt 网络编程)
1. Qt中有哪些网络编程相关的类?Qt 提供了一些网络编程相关的类,主要用于网络通信、数据传输和处理。常用的类包括:QTcpSocket:用于 TCP 网络通信的客户端套接字。QUdpSocket:用于 UDP 网络通信的客户端套接字。QTcpServer:用于创建 TCP 服务器,监听客户端连接。QNetworkAccessManager:用于发起和管理网络请求,支持 HTTP、HTTPS、FTP 等协议。QNetworkReply:封装来自 QNetworkAccessManager 的响应信息。QHostAddress:用于表示 IP 地址。QNetworkConfigurationM...
C++八股文全集
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
AI 应用开发学习全景路线图
1.3W
2
...
计算机专业如何找实习?(26届计算机找实习经验帖)
4754
3
...
大厂到底想要什么样的人???
3307
4
...
百度Agent智能体研发日常实习一二面
3099
5
...
面试官视角聊聊,AI大模型产品到底是做什么的?
2870
6
...
害怕被嘲笑就不去做了吗?
2112
7
...
纯前端网页拼图小游戏制作
1462
8
...
字节前端一面
1236
9
...
2026的你,应该知道哪些AI面试题?
1143
10
...
不是哥们,腾讯26年暑期实习这就开了??
1049
创作者周榜
更多
正在热议
更多
#
论秋招对个人心气的改变
#
3586次浏览
69人参与
#
牛客AI体验站
#
1839次浏览
63人参与
#
刚入职的你踩过哪些坑
#
2540次浏览
61人参与
#
在大厂上班是一种什么样的体验
#
2096次浏览
26人参与
#
程序员找工作至少要刷多少题?
#
4868次浏览
82人参与
#
关于春招/暑期实习,你想知道哪些信息?
#
2713次浏览
64人参与
#
一张图晒一下你的AI员工
#
1646次浏览
45人参与
#
为了减少AI幻觉,你注入过哪些设定?
#
1034次浏览
35人参与
#
我现在比当时_,你想录用我吗
#
2571次浏览
42人参与
#
程序员能干到多少岁?
#
3707次浏览
53人参与
#
产品人求职现状
#
320359次浏览
2422人参与
#
AI Coding的使用心得
#
1482次浏览
38人参与
#
你的工资什么时候发?
#
55496次浏览
345人参与
#
实习,不懂就问
#
163079次浏览
1453人参与
#
你投了多少份简历了?
#
421542次浏览
3937人参与
#
金三银四,你有感觉到吗
#
679434次浏览
6047人参与
#
帆软软件工作体验
#
12493次浏览
67人参与
#
暑假倒计时,你都干了些啥?
#
40153次浏览
213人参与
#
晒晒你司的新年福利
#
2430次浏览
47人参与
#
软开人,秋招你打算投哪些公司呢
#
180036次浏览
1379人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务