秋招面经-字节音频算法工程师

2025.9.2 面试时长80分钟17.00~18.20

Docker容器的使用,用来干嘛

C++,多态,虚函数是怎么实现的,底层是怎样的

如果有一个unsigned 32类型数据,我要对其中某位置1,应该怎么实现

QT,信号与槽和回调函数的区别(有很大区别,回答了区别不大,回调一般是一对一,信号与槽可以一对多,发送方只管发送信号且可以跨线程)

stft,窗函数有哪些,都是怎样实现的,分别有什么特点

Transformer,交叉注意力,掩码注意力,自注意力,这集中注意力是怎样实现的,有什么区别

介绍毕设项目,DMCRN,RCAT-UNet

介绍端到端语音增强模型,介绍RCAT-UNet模型内部结构

为什么选时域的端到端模型

模型选用的损失函数是怎么样的

评估语音模型复杂度的指标

语音信号前处理的预加重是什么意思,怎么操作(很久之前看的,模糊记得是加重高频成分,特征提取时比较均衡,蒙对了

介绍实习项目,主要在企业做什么,讲讲模型QAT到板端部署的流程,过程中有没有遇到什么困难(GRU的量化,与重写算子,训练速度极大降低,tflite,tflite-micro,onnx2c的使用)

cnn和rnn两个模型谁的速度快(分点进行了回答,训练和推理两种情况,流式,顺便提了一嘴Mamba加戏)

有没有试过PTQ,PTQ是怎么实现的,进行校准的数据集选取对最终结果的影响(先介绍PTQ原理,数据集的数量选取做了多组实验,讲结果如何,最后于QAT精度对比,损失大)

部署时板端的资源如何,主要在什么设备部署(低计算资源**MB的MCU,嵌入式设备,移动端)

用的是什么精度的量化(INT8),为什么要用这个精度(板端支持,模型理论压缩四倍,推理相比FP32很快,精度损失很小,提供量化指标对比,与浮点模型结果进行对比)

板端推理时候,使用CPU或者使用NPU设备,速度上有什么体现吗,会快多少(NPU比CPU快十多倍左右)

问第二段实习在电科主要做什么工作

介绍传统算法,谱减法,维纳滤波,都是如何实现的(基于噪声,信噪比估计)

了解麦克风阵列算法吗(没做过,只做过天线阵列)

算法题,实现一个卷积算子,输入1234与123,实现卷积输出

#发面经攒人品#
全部评论
你好,可以转载到我的公众号上 音频信号处理那些事儿 上吗,会标注转载来源的~
点赞 回复 分享
发布于 昨天 10:10 北京
小哥哥好厉害
点赞 回复 分享
发布于 09-03 19:27 山东

相关推荐

评论
1
4
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务