段段Steady

03-17 18:09 已编辑百度_高级研发工程师

发布于北京

关注

TCL鸿鹄实验室一面：AI语音项目被问麻了

话不多说，上面经（一面已过）。

一、面试背景

岗位：TCL鸿鹄实验室 - AI语音。相关时长：约35分钟。形式：技术一面

我这边背景：百度高级研发，6年经验，主做AI语音项目（商机智能平台），之前华为待过，算是从大厂跳大厂的节奏。

面试官很专业，问的问题基本都是围绕我的项目深度展开，没问八股，全是场景题和设计题。我只能说——干得漂亮。

（那也就是说，刷的算法，背的八股，基本上是没用了，而且不只这一个面，很多面试都不考算法和基础八股了，这难道只是我的幸存者偏差吗）

二、核心问题复盘

1️⃣ 自我介绍（2分钟）

标准流程，我简单说了下三段经历：

百度：商机智能平台，面向广告主的智能营销系统，融合文心大模型
华为：政务审批与执法平台，流程引擎那一套
之前：互联网营销系统

面试官听完直接切入项目细节，没有废话。

2️⃣ 多租户智能对话引擎设计

问题：你们的多租户对话引擎怎么设计的？WebSocket连接层怎么做的？

我的回答：

这块我负责三个核心模块：

核心业务服务设计
实时数据链路
结构化入仓

连接层架构：

用户 → 外部WebSocket接入层(Gateway) → Netty服务 → Kafka → 对话服务(UFO)

关键设计：

第一层：接入层

不让业务服务直接暴露WebSocket，单独做了一层Gateway
WebSocket连接建立时带Token，解析出租户ID、用户ID等，存到Redis
后续消息根据UID路由到正确节点

第二层：WebSocket实现

没用Spring自带的WebSocket（太重）
用Netty自己实现了一套，更轻更稳定
Netty的线程模型天然适合这种I/O密集场景

第三层：消息路由

前端发消息 → Netty → Kafka → 对话服务
对话服务无状态，不知道客户端在哪个节点
通过Redis查SessionID → 本地Map找节点 → 写回WebSocket

面试官追问：为什么Netty比Spring WebSocket好？

我说：本质上是Reactor多线程模型，一个线程监听多个连接，避免"一连接一线程"的高开销。Netty在此基础上做了一层抽象，EventLoop绑定多个Channel，同一Channel的所有I/O事件永远在同一个线程处理，避免线程切换开销。

3️⃣ Kafka消息顺序性与不丢消息

问题：Kafka怎么保证消息顺序？怎么保证不丢消息？（这倒是老一套了，感觉例行公事，消息丢失，顺序消费这玩意）

我的回答：

这块分两套策略，顺序消费和不丢消息是两个问题。

顺序性保证：

Kafka本身只能保证单Partition有序，所以我们做了两层约束：

生产端：

按业务Key（用户ID）做分区
通过Hash指定Partition
同一用户的消息一定在同一分区

消费端：

一个Partition对应一个消费线程
业务处理必须串行
要提升并发就加Partition数量

不丢消息保证：

分三层：生产端、Broker、消费端

生产端：

acks=all（所有副本确认）
重试机制
幂等生产配置

Broker：

多副本机制
Leader + Follower复制
极端情况：多节点同时挂了才丢数据（概率极低）

消费端：

关闭自动提交
先处理业务，再手动commit
处理失败不提交，重新消费

4️⃣ ThreadPoolExecutor参数配置

问题：IO密集型的线程池怎么配？（线程池，线程池，还是线程池）

我的回答：

核心公式：

线程数 ≈ CPU核心数 × (1 + 等待时间/计算时间)

IO密集型特点：大部分线程在等待，等待时间 > 计算时间，所以线程数可以远大于CPU核心数。

我的经验值（8核机器）：

核心线程数：16-32（CPU核数 × 2-4）
最大线程数：64-96（核心线程 × 2-3）
队列：短任务（如RPC调用）：有界队列，容量1000左右长任务（如WebSocket消息）：小队列或不排队
拒绝策略：CallerRunsPolicy，让调用线程自己执行，天然限流

但这是经验值，具体要看压测结果。核心指标是CPU利用率、队列长度、拒绝次数。

5️⃣ 语音实时通信的首包延迟优化（重点来了！）

问题：如果场景是语音实时双向通信，首包延迟怎么优化？网络抖动丢包怎么办？

我的回答：（我说实话，这块最开始卡壳了，后来面试官正好接了个电话，我赶紧重整思路，最后还是说出来了）

这块核心是低延迟流式通信 + 弱网环境的问题。

首包延迟优化：

我分三层来答：

第一层：连接建立

WebSocket预连接：用户进入页面就建立连接，不等点击通话
用WSS不用WS，避免重定向
TCP Fast Open（TFO）：跳过三次握手
就近接入：CDN或加速节点，连接最近的网关

第二层：协议层

不带冗余心跳，首次只传关键数据
用Protobuf替代JSON，减少传输量
WebSocket消息头优化，减少边界等待

第三层：服务端

预热进程池
首帧优先级最高，优先转发

网络抖动丢包：

应用层：

前向纠错（FEC）
丢包重传（NACK）
包合并 + 抖动缓冲
动态调整发送频率

策略层：

客户端 + 网关做抗抖动缓冲
网络好时多缓冲，差时少缓冲
严重时降码率、静音检测（没声音不发包）
极端情况：错误隐藏（用前一帧插值）

这块我说得比较细，面试官点头表示认可。

6️⃣ 大模型幻觉对抗（AI时代经典问题！）

问题：大模型幻觉怎么解决？输出JSON格式怎么保证？

我的回答：

这块我们分三层：数据层、生成层、结果层。

数据层：

不让模型自由发挥，通过用户问题 → 检索企业数据 → 拼进Prompt
多路召回（关键词 + 向量），再做一次排序过滤
上下文精简：只保留相关对话，减少干扰

生成层：

强规则Prompt："只能基于提供的数据回答，数据中没有不允许编造"
结构化输出：让模型输出JSON（商机名称、推荐理由、数据来源），限制表达范围
降低温度（0.5左右），减少随机性
多轮对话拆成两步：先理解意图，再生成结果

结果层：

规则校验：字段完整、类型正确
数据一致性检查：查库确认数据存在
自我修复：模型输出格式错误时，把错误内容喂回去，让模型修正（成功率95%+）
兜底策略：重试3次失败 → 返回模板回答

三、面试感受

整场面试没有八股文，也没有算法，全是围绕项目的深度挖掘，整的我全白学了，不过也没关系，这样挺好的。

面试官问得很细，但都是在考察我的系统设计能力和工程落地能力。

我的感觉：

项目要熟：每个技术选型要能说清楚为什么
要有深度：不能停留在"怎么用"，要讲"为什么这么设计"
要能拆解：复杂问题分层次回答，一层一层剥

最后我问了面试官三个问题：

公司技术栈是什么？
多久出结果？
这个岗位具体做什么？

面试官说："语音相关，AI方向，后面还有二面。暗示过了。

四、总结

这场面试问的核心点：

WebSocket架构设计
消息中间件（Kafka顺序性 + 可靠性）
并发编程（线程池配置）
实时音视频（首包延迟 + 抗抖动）
AI工程化（幻觉对抗 + 结构化输出）

全是实打实的场景题，没有虚的，这多亏我之前自己搞了一个全双工语音项目。

建议：如果你也面AI语音岗，把上面这几个点吃透，尤其是实时通信和大模型应用这两块，问的概率很高。

#AI求职实录#

全部评论

推荐最新楼层

许愿赢下每一场面

门头沟学院 Java

哈哈，语音实时通信那块讲得真细喔

1 回复分享

发布于 03-18 14:15 广东

Tackle4_Star

门头沟学院 Java

真实，，，我也是狂准备算法面，结果现在大厂都开始问场景设计了...

点赞回复分享

发布于 03-18 18:25 广东

求职勇敢鹅

门头沟学院 Java

Netty那块说得挺细的，我之前只知道WebSocket但没深究过底层实现

点赞回复分享

发布于 03-18 18:25 北京

牛肉葱油饼

门头沟学院 Java

刚背完红黑树准备面试，结果现在都不考这些了吗？

点赞回复分享

发布于 03-18 18:24 上海

脑袋困掉了

北京理工大学汽车电子工程师

最后面试官暗示过了，但是又悬着的感觉，可太绝了我去

点赞回复分享

发布于 03-18 14:15 北京

xzxze

韶关学院算法工程师

点赞回复分享

发布于 03-18 00:33 广东

04-18 12:48

香港中文大学（深圳）人工智能

【暑期实习】华为 AI 工程师一面复盘

项目深挖很多，最后还有一道“手写”代码题这场华为 AI 工程师暑期实习的面试，整体节奏比较完整，基本就是“自我介绍—项目深挖—反问—代码题”这一套。刚开始先让我共享桌面，结合简历做自我介绍，讲自己的学习背景、做过的项目，以及现在的方向。前面这部分我还是按自己的主线来讲：山大本科电子和计算机双修，港中深硕士，方向慢慢转到 AI Infra、异构计算和性能优化；实习这边讲了之前做过的通用软件工程工作，以及现在做的算子优化和图优化相关内容。面试官前面没有特别打断，但后面几乎每一段都会继续往下追。项目里问得最多的，一个是我自己做的量化推理 runtime，另一个是现在在做的算子/图优化相关工作。量化项...

查看18道真题和解析

点赞评论收藏

05-01 10:20

门头沟学院 Java

先入门再提升

就业行情不好，内卷愈发严重。在我看来，与其死磕完美目标、原地空耗焦虑，不如放宽预期，先找一份工作落脚入门。尤其对于刚毕业的应届生来说，比起一味挑薪资、挑平台，先入行、先扎根才是重中之重。先走进职场，积累实战经验，摸清行业节奏，找到自己真正感兴趣的方向，沉下心深耕坚持下去。好行情靠机遇，坏行情靠沉淀，先站稳脚跟慢慢成长，往后才有资本再去抬高自己的标准。

你会因为行情，降低找工作...

点赞评论收藏

04-19 11:36

重庆大学 Java

Pdd-三面-4.17

上来先手撕：非递归实现后序遍历二叉树，磨蹭半天写出来了请简单介绍一下你自己做的项目，以及大概用到了哪些组件（中间件）？是否了解分布式系统的 CAP 理论？这大概是一个什么样的问题？在你的项目中，使用分布式锁主要是为了解决什么问题？如果改为异步的方式，还能判断“一人一单”吗？秒杀场景下，先判断“一人一单”再判断“库存是否足够”，这一套逻辑具体是在哪里判断的？项目中的 Redis 是单节点部署的吗？如果变成集群部署，库存在一致性的问题？Redisson 分布式锁的实现原理是什么样的？布隆过滤器？如果让你设计一个工作在多线程并发环境下的本地先进先出（FIFO）队列，且为了性能要求是无锁（Lock-f...

查看16道真题和解析

点赞评论收藏

04-19 22:45

苏州大学嵌入式软件开发

AI时代还有必要刷leetcode吗？

刷LeetCode还是有必要，但得针对性。纯刷算法题的话，对嵌入式开发直接帮助有限，不过像数组、链表、树这些基础数据结构，是单片机多任务调度、外设通信协议实现的核心。比如处理SPI数据传输、RTOS消息队列时，扎实的算法基础能让代码更高效。我现在会优先刷和嵌入式相关的算法题，比如位运算、动态规划这类，同时结合STM32项目练手。AI能辅助写代码，但逻辑优化、资源受限场景下的算法设计，还是得靠自己扎实的功底。

AI时代还有必要刷lee...

点赞评论收藏

04-25 14:55

C++

具身智能+ROS2+机器人就业方向分析

春招你拿到offer了吗

点赞评论收藏

招聘动态

上海人工智能实验室

2026年春季校园招聘

联想

27届暑期实习

厦门银行

2026届春季校园招聘

联想

26届补录

27届校招宝典

快手

27届实习超多转正机会

全站热榜

创作者周榜

正在热议

# 这个offer值得去吗？ #

13683次浏览 151人参与

# 金三银四，你的春招进行到哪个阶段了？ #

35607次浏览 332人参与

# 联宝杯大学生创新大赛，你的技术值得产业级答案 #

# 招银网络科技（深圳）有限公司成都分公司笔试 #

# 军工所铁饭碗 vs 互联网高薪资，你会选谁 #