26.4.22 小红书直播cpp音视频一面
一、基本情况与项目背景
1.请做一个简单自我介绍。
2.详细介绍一下你在字节做的端智能 SDK / 特征平台项目。
3.端上的原始数据流主要包含哪些内容?
4.这些数据是在端上落库,还是会上报云端?两条链路分别做什么?
5.业务方如何注册、消费自定义特征?
二、设备特征缓存优化
6.设备特征缓存优化的背景是什么?原来性能瓶颈在哪里?
7.为什么设备特征可以牺牲一部分时效性来换性能?
8.为什么从统一 TTL 改成 2 秒 / 10 秒 / 90 秒分层 TTL?
9.不同 TTL 档位分别适合哪些设备特征?
10.你们是如何通过打点、实验和 A/B 验证优化效果的?
三、C++ 智能指针
11.你对 C++ 智能指针的理解是什么?
12.unique_ptr、shared_ptr、weak_ptr 分别适合什么场景?
13.shared_ptr 的引用计数机制是什么?
14.weak_ptr 如何解决 shared_ptr 的循环引用问题?
四、特征 SQL 复用优化
15.端上 SDK 为什么会涉及 SQL 复用优化?
16.端上本地数据库里存的是什么,业务方为什么会查它?
17.特征 SQL 查询的性能瓶颈是什么?
18.为什么这些 SQL 可以模板化、签名化和合并?
19.为什么第一版 UNION ALL 优化效果不理想?
20.后续“提取时间戳 + 最小时间戳查询 + 应用层分发”的方案是怎么做的?
21.SQL 优化最终在单模块和全链路上分别带来了多少收益?
五、直播端智能 / ABR 开放题
22.你了解 ABR 吗?
23.如果要判断用户是“画质敏感型”还是“流畅度敏感型”,你会在端上采集哪些特征?
24.你会如何结合设备信息、网络状态、历史行为来设计直播画质 / 流畅度策略?
25.端智能场景里,你是否接触过模型推理链路?
六、AI 投资分析系统 / Multi-Agent
26.介绍一下你的多 Agent 投资分析系统。
27.主控 Agent、数据 Agent、新闻 Agent、知识库 Agent、分析 Agent 分别负责什么?
28.多 Agent 之间的数据和上下文是怎么流转的?
29.相比单 Agent,多 Agent 架构在上下文管理、幻觉控制和问题排查上有什么优势?
30.多 Agent 架构会带来哪些复杂度和维护成本?
31.真实金融行情数据是如何通过 API 接入系统的?
七、Skill / 智能日志分析开放题
32.你有没有自己写过 skill?平时如何使用 skill?
33.如果要做一个直播播放日志智能分析工具,你会设计成 Agent 还是 Skill?为什么?
34.如果有历史文档和代码库说明日志含义,你会如何构建知识库或 RAG?
35.用户反馈某个视频播放卡顿时,如何定位、筛选并分析对应播放日志?
36.日志分析系统里,工具调用、RAG、意图识别、日志筛选、错误码解释分别怎么设计?
37.你会选择 ReAct、Plan-and-Execute,还是其他框架来实现这个日志分析系统?
八、计算机网络 / 拥塞控制
38.你了解拥塞控制吗?它主要解决什么问题?
39.拥塞窗口是如何变化的?
40.慢启动、拥塞避免、丢包后的窗口调整分别是怎么回事?
九、C++ 基础 / 多态
41.说一下 C++ 的多态特性。
42.静态多态和动态多态分别是什么?
43.动态多态如何通过继承、虚函数、虚函数表实现?
十、Git 基础
44.你实习开发中常用哪些 Git 指令?
45.你平时如何创建分支、提交代码、推送代码、拉取更新?
46.遇到 Git 冲突一般怎么处理?
十一、算法题:两个有序数组中位数
47.用 C++ 实现两个有序数组取中位数。
48.先讲一下你的解题思路。
49.暴力合并排序方案有什么可以优化的地方?
50.既然两个数组本身有序,能否用双指针合并,避免再次 sort?
51.有没有更高阶的二分解法?
十二、实习时间与岗位匹配
52.你本科期间是怎么安排时间去北京字节实习的?
53.如果来小红书实习,最早什么时候可以到岗?
54.你更倾向上海还是北京 base?
55.你对“产品工程师”这个岗位定位的理解是什么?
56.你对直播 SDK / 播放器 SDK / 端智能策略方向是否感兴趣?
1.请做一个简单自我介绍。
2.详细介绍一下你在字节做的端智能 SDK / 特征平台项目。
3.端上的原始数据流主要包含哪些内容?
4.这些数据是在端上落库,还是会上报云端?两条链路分别做什么?
5.业务方如何注册、消费自定义特征?
二、设备特征缓存优化
6.设备特征缓存优化的背景是什么?原来性能瓶颈在哪里?
7.为什么设备特征可以牺牲一部分时效性来换性能?
8.为什么从统一 TTL 改成 2 秒 / 10 秒 / 90 秒分层 TTL?
9.不同 TTL 档位分别适合哪些设备特征?
10.你们是如何通过打点、实验和 A/B 验证优化效果的?
三、C++ 智能指针
11.你对 C++ 智能指针的理解是什么?
12.unique_ptr、shared_ptr、weak_ptr 分别适合什么场景?
13.shared_ptr 的引用计数机制是什么?
14.weak_ptr 如何解决 shared_ptr 的循环引用问题?
四、特征 SQL 复用优化
15.端上 SDK 为什么会涉及 SQL 复用优化?
16.端上本地数据库里存的是什么,业务方为什么会查它?
17.特征 SQL 查询的性能瓶颈是什么?
18.为什么这些 SQL 可以模板化、签名化和合并?
19.为什么第一版 UNION ALL 优化效果不理想?
20.后续“提取时间戳 + 最小时间戳查询 + 应用层分发”的方案是怎么做的?
21.SQL 优化最终在单模块和全链路上分别带来了多少收益?
五、直播端智能 / ABR 开放题
22.你了解 ABR 吗?
23.如果要判断用户是“画质敏感型”还是“流畅度敏感型”,你会在端上采集哪些特征?
24.你会如何结合设备信息、网络状态、历史行为来设计直播画质 / 流畅度策略?
25.端智能场景里,你是否接触过模型推理链路?
六、AI 投资分析系统 / Multi-Agent
26.介绍一下你的多 Agent 投资分析系统。
27.主控 Agent、数据 Agent、新闻 Agent、知识库 Agent、分析 Agent 分别负责什么?
28.多 Agent 之间的数据和上下文是怎么流转的?
29.相比单 Agent,多 Agent 架构在上下文管理、幻觉控制和问题排查上有什么优势?
30.多 Agent 架构会带来哪些复杂度和维护成本?
31.真实金融行情数据是如何通过 API 接入系统的?
七、Skill / 智能日志分析开放题
32.你有没有自己写过 skill?平时如何使用 skill?
33.如果要做一个直播播放日志智能分析工具,你会设计成 Agent 还是 Skill?为什么?
34.如果有历史文档和代码库说明日志含义,你会如何构建知识库或 RAG?
35.用户反馈某个视频播放卡顿时,如何定位、筛选并分析对应播放日志?
36.日志分析系统里,工具调用、RAG、意图识别、日志筛选、错误码解释分别怎么设计?
37.你会选择 ReAct、Plan-and-Execute,还是其他框架来实现这个日志分析系统?
八、计算机网络 / 拥塞控制
38.你了解拥塞控制吗?它主要解决什么问题?
39.拥塞窗口是如何变化的?
40.慢启动、拥塞避免、丢包后的窗口调整分别是怎么回事?
九、C++ 基础 / 多态
41.说一下 C++ 的多态特性。
42.静态多态和动态多态分别是什么?
43.动态多态如何通过继承、虚函数、虚函数表实现?
十、Git 基础
44.你实习开发中常用哪些 Git 指令?
45.你平时如何创建分支、提交代码、推送代码、拉取更新?
46.遇到 Git 冲突一般怎么处理?
十一、算法题:两个有序数组中位数
47.用 C++ 实现两个有序数组取中位数。
48.先讲一下你的解题思路。
49.暴力合并排序方案有什么可以优化的地方?
50.既然两个数组本身有序,能否用双指针合并,避免再次 sort?
51.有没有更高阶的二分解法?
十二、实习时间与岗位匹配
52.你本科期间是怎么安排时间去北京字节实习的?
53.如果来小红书实习,最早什么时候可以到岗?
54.你更倾向上海还是北京 base?
55.你对“产品工程师”这个岗位定位的理解是什么?
56.你对直播 SDK / 播放器 SDK / 端智能策略方向是否感兴趣?
全部评论
怎么还在面试
相关推荐
查看23道真题和解析 点赞 评论 收藏
分享
kalistar:电气专业有几个能去电网的🤣
点赞 评论 收藏
分享
