秋招面经-字节音频算法工程师
2025.9.2 面试时长80分钟17.00~18.20
Docker容器的使用,用来干嘛
C++,多态,虚函数是怎么实现的,底层是怎样的
如果有一个unsigned 32类型数据,我要对其中某位置1,应该怎么实现
QT,信号与槽和回调函数的区别(有很大区别,回答了区别不大,回调一般是一对一,信号与槽可以一对多,发送方只管发送信号且可以跨线程)
stft,窗函数有哪些,都是怎样实现的,分别有什么特点
Transformer,交叉注意力,掩码注意力,自注意力,这集中注意力是怎样实现的,有什么区别
介绍毕设项目,DMCRN,RCAT-UNet
介绍端到端语音增强模型,介绍RCAT-UNet模型内部结构
为什么选时域的端到端模型
模型选用的损失函数是怎么样的
评估语音模型复杂度的指标
语音信号前处理的预加重是什么意思,怎么操作(很久之前看的,模糊记得是加重高频成分,特征提取时比较均衡,蒙对了)
介绍实习项目,主要在企业做什么,讲讲模型QAT到板端部署的流程,过程中有没有遇到什么困难(GRU的量化,与重写算子,训练速度极大降低,tflite,tflite-micro,onnx2c的使用)
cnn和rnn两个模型谁的速度快(分点进行了回答,训练和推理两种情况,流式,顺便提了一嘴Mamba加戏)
有没有试过PTQ,PTQ是怎么实现的,进行校准的数据集选取对最终结果的影响(先介绍PTQ原理,数据集的数量选取做了多组实验,讲结果如何,最后于QAT精度对比,损失大)
部署时板端的资源如何,主要在什么设备部署(低计算资源**MB的MCU,嵌入式设备,移动端)
用的是什么精度的量化(INT8),为什么要用这个精度(板端支持,模型理论压缩四倍,推理相比FP32很快,精度损失很小,提供量化指标对比,与浮点模型结果进行对比)
板端推理时候,使用CPU或者使用NPU设备,速度上有什么体现吗,会快多少(NPU比CPU快十多倍左右)
问第二段实习在电科主要做什么工作
介绍传统算法,谱减法,维纳滤波,都是如何实现的(基于噪声,信噪比估计)
了解麦克风阵列算法吗(没做过,只做过天线阵列)
算法题,实现一个卷积算子,输入1234与123,实现卷积输出
#发面经攒人品#