2023暑期实习-语音算法面经记录

  • 背景
    本211硕985,语音前端算法(不是识别)

  • oppo
    面了一次,不太符合(他们要的是语音合成相关的),感谢信

  • 外研社
    他们是做发音评测打分相关的东西。给人感觉有种不正规的小作坊感觉,技术人员同时也是hr,一面之前就直接加了微信,然后告诉我明天要问哪些哪些,这个操作属实有点让我震惊了。一共面了两次。第一面问了项目相关,了解到是我自己写的pipeline之后要看我的模型源码……说是之前有人把不是自己主负责的项目也写上去了,所以要确认一下……有手写代码环节,先出了一题动态规划的,我说我leetcode还没刷多少能不能换一题(我太菜了orz),然后换了一题斐波纳契数列和二分查找。最后面试官一直强调之前有人到了最后环节拒了offer,然后反复确认能不能来。二面也没有发邮件约面试,直接就是微信上说组里的boss想聊一聊。offer给五天时间考虑,也拒了。

  • 思必驰
    面试体验第二好的公司。晚上七点面的,面试官比较懂技术,基本也是围绕着项目在介绍(oppo之后我就搞了一个ppt……),大概面了五十分钟左右。有个插曲,我介绍完项目之后还特意问了一下要不要看源码(被外研搞怕了),面试官说不用不用。有转正机会。offer给15天时间考虑。

  • 杜比实验室
    面试体验第一好的一次。有两个面试官,其中一个在美国。没有听我介绍项目,直接问问题,分三个部分,非常专业。可惜没有转正。

    • 信号处理部分: 奈奎斯特频率,采样定理,语音分帧时候的FFT点数,为什么FFT之后的结果有一半是冗余的,什么是因果系统,FFT分辨率
    • 深度学习部分: 各种归一化,问的很细。感受野计算,空洞卷积,因果卷积怎么实现,复数卷积。然后问了DPRNN,一维卷积和二维卷积比的好处,噪声的过度抑制。 最后还介绍了一些目前实验室降噪算法的方向(主要是用生成式模型做降噪,比如SEGAN)。
  • 腾讯音乐TME天琴实验室
    不愧是大厂,一面面试官简单听我介绍了一下项目,然后加了微信(能看出来是面试官本身也是技术人员)。本来以为没有机会了,没想到面完杜比之后又约了二面。
    二面面试官是个中年人,有些严肃,但也比较和善,是体验和思必驰一样棒的一次面试。反问环节主动向我详细介绍了现在的业务覆盖内容,让我惊叹于不愧是腾讯音乐,平台大,业务广,叹为观止orz
    然后是腾讯音乐的集体笔试,三题就写出来一道送分题,一度以为寄了……不过hr还是约了后续,只不过最后选择了杜比,有些遗憾,毕竟腾讯音乐是有转正机会的……

    很犹豫是选杜比还是腾讯音乐,最后还是选了杜比,但是秋招的时候又得重新投了,而且秋招肯定比实习的难度大很多,不知道自己的选择是不是正确…… 希望能给其他投语音算法的uu们提供一点经验

#面经##秋招##正在实习的你,有转正机会吗?##我的实习求职记录##23届找工作求助阵地#
全部评论
大佬您好,oppo的过程可以详细说一下吗?
2 回复 分享
发布于 2023-04-30 21:16 广东
请问杜比包午饭吗hhh
1 回复 分享
发布于 2023-10-18 15:58 北京
请问AI音乐部分,腾讯问的啥呀
点赞 回复 分享
发布于 2023-09-14 18:44 四川
兄弟 你是哪个老师的学生啊?东大做语音的很少
点赞 回复 分享
发布于 2023-04-15 14:15 江苏
楼主有了解腾讯的天籁实验室吗
点赞 回复 分享
发布于 2023-03-28 12:38 北京
楼主,请问杜比实验室是在他们官网投递的吗,都没看到实习生岗位哎
点赞 回复 分享
发布于 2023-03-28 11:19 安徽
想问一下楼主怎么投的杜比哇?我在boss直聘上问他们,他们都不理我
点赞 回复 分享
发布于 2023-03-28 09:21 湖北
那楼主现在是拿到哪家offer了,签了哪家?
点赞 回复 分享
发布于 2023-03-27 22:45 山东

相关推荐

结合最近辅助修改的简历及项目,老师总结了部分大模型微调简历的踩雷点。🙅‍♂️错误示范:在 x任务中,获取 xxx 条数据,通过规则 or 脚本清洗出 x 条数据,然后微调 y 大模型,在业务上提升 x 个点。✍🏻原因:大模型微调的平台是现成的,基模是现成的,体现不出核心能力。✅应该怎么写?首先介绍业务背景:业务是一个销售对话业务,机器人是销售,代替真人,直接面对用户。我们会给模型设定任务,任务是 prompt 。步骤1️⃣.提取训练数据问题:1.真人通话每通电话任务是未知的,我们训练数据是任务+通话的 pair 对。2.真人通话很乱,与客户的对话是各种交叉的,导致 asr 后并不是一人一轮。解决方案:1.首先通过大模型 prompt 对该通电话提取任务,得到任务+ pair 对。需要用到 cot + reflection +多 Ilm 一致性+ debating 的模式。2.使用大模型根据以上任务和真人对话,让大模型编写出通话内容。提问,为什么要编写而不是直接用?步骤2️⃣.制定训练数据集问题:1、正常的对话内容,前面几句和后面几句基本上一致的。都是问候和拜拜,但是也有一些差异。2、因为都是相似场景,虽然任务不同,但是很多场景语义很相似。解决方案:1、基于轮次的权重采样:通过轮次设定权重进行 weighting sample 。解决问候和拜拜的高占比问题。2、基于语义的采样:使用 bert 对对话内容进行 embedding ,然后使用层次聚类通过调节阈值聚类出相似语义的类。对一个类里的样本进行随机采样,提问,为什么要对重复语义的数据进行下采样?3、基于客户类型和产品的采样,因为很多产品是热品,导致对话内容有偏,用户类型一样,需按照类型调整整体比例采样。提问,为什么要这么采样?步骤3️⃣.制定训练数据集我们直接把输出当作 target 进行训练。使用的 lora 训练,但是 lora alpha 设定成为4倍的时候达到了比较好的效果,经验值不同任务不一样,提问,在各种情况下要怎么调?步骤4️⃣.dpo训练问题:v1版本训练时,很多输出内容是对的,但是输出的语气不太像真人,机器人味还是很严重。解决方案:由于训练本身是有 ground truth 的,因此使用v1训练的模型,预测训练集,使用大模型对比两者语气不符合训练集的拿出来,使用训练集的 ground truth 和模型的预测数据作为 dpo 训练对,对v1版本模型重新训练。📳这里老师只是简要进行概括解答,具体情况和详细解答可以咨询辅导,如果想了解项目辅导,提升面试能力,欢迎后台联系。#算法# #简历中的项目经历要怎么写# #算法岗面试# #互联网大厂招聘#
点赞 评论 收藏
分享
评论
10
51
分享

创作者周榜

更多
牛客网
牛客企业服务