崩溃了!字节跳动-你扛过几面?-抖音亿级评论系统的实时存储与热度排序设计

🔥 字节跳动2026年4月面试真题,二面/三面必刷,高级后端/架构师专属,难度直接拉满 ⭐⭐⭐⭐⭐

系统设计图-如图
https://uploadfiles.nowcoder.com/images/20260416/369475507_1776322994550/9FB54BF16CC07A4853DDBBF919D8252F

📌面试干货|直接上硬菜:

设计抖音的评论系统

要求:

1、支持单条视频百万级评论的实时发布与读取;
2、评论列表默认按热度(综合点赞、回复、时间等因素)排序,也需支持按时间正/倒序切换;
4、核心接口P99延迟<100ms。请给出数据存储、缓存、热度计算与更新、分页查询的完整设计方案,并解决高并发写和‘深分页’的性能问题。

💡 【解析】|划重点!

家人们谁懂啊!这道题看似常规,实则藏着字节的“小心机”——结合抖音亿级流量的极端场景,直接考察你能不能hold住高并发、复杂排序、缓存设计这些硬技能,是区分普通后端和高级后端的关键题!

🎯 核心设计思路|手把手拆解,小白也能看懂

1. 存储架构|百万级评论的“藏身之处”
核心目标:搞定单视频百万评论的存储,避免跨分片拖慢速度,主打一个高效!

💾 主存储选择:分库分表的MySQL / 分布式数据库(如TiDB),高并发读写稳得一批~

🔑 分片策略:以video_id为分片键,同一视频的评论全放一个分片,杜绝跨分片查询的坑!

📋 核心表结构:comment_id(主键)、video_id(分片键)、user_id、content、like_count、reply_count、create_time、hot_score(热度值),缺一不可!

2. 热度计算|热门评论怎么“选”出来?
避坑提醒:热度是动态变化的,实时计算必崩!最优解就是「异步计算+定期更新」,主打一个省资源、不卡顿~

热度计算公式|直接抄作业:hot_score = log10(like_count×2 + reply_count) + (create_time - 固定基点时间戳)/衰减因子

计算逻辑:由离线/近线任务批量算,定期把hot_score更回数据库,既不拖慢接口,又能实时跟上热度变化,完美!

3. 缓存与读取策略|P99<100ms的关键操作
多级缓存叠buff,延迟直接打下来!流程图一看就懂,建议收藏备用👇

https://uploadfiles.nowcoder.com/images/20260416/369475507_1776323096089/6E3CC017A8AC43BBAFDBFFAC33E48513

🖥️ 本地缓存:缓存顶级热门视频的前几页热评,TTL设10秒,减少Redis压力,快到飞起!

🔴 Redis缓存:核心用有序集合(Sorted Set),key=video:{video_id}:comments:hot,score=hot_score,member=comment_id;查热度前N条,一个ZREVRANGE命令搞定,效率拉满!

🔄 缓存更新机制:

    评论发布/删除:同步更新数据库,并异步发送消息到MQ。一个Worker消费消息,重新计算该视频评论列表的缓存(或仅更新受影响的有序集合成员)。

点赞/回复:这些行为会改变热度。通过消息队列异步触发对应评论hot_score的重算,并更新Redis有序集合中的分数。

4. 深分页问题|后端人的“噩梦”,这样破解!

🔥 热度排序分页
直接躺赢!Redis有序集合的ZREVRANGE key start end命令,天然支持高效分页,不用额外折腾,直接定位目标页码~

⏰ 时间排序分页
避坑!别用LIMIT M, N(会扫前M条无用数据),改用WHERE create_time < {上一页最后一条时间},精准定位,速度翻倍!

🌰 真实业务场景|抖音评论区背后的真相
家人们,这可不是纸上谈兵!咱们点开抖音任意热门视频,评论区能秒刷、实时更,背后就是这套架构在撑着~ 比如央视新闻发一条视频,几分钟涌入几十万条评论,系统既要扛住高并发写入,又要让所有人看到实时热门评论,体验丝滑不卡顿,全靠这些设计!

📚 【核心考点】|必背!面试直接套

✅ 关系型数据库与NoSQL的混合协同设计

✅ Redis高级数据结构(Sorted Set)的实战应用

✅ 复杂指标(热度)的异步计算模型

✅ 高并发写入下的最终一致性保证

✅ 数据库深分页的优化方案

⚠️ 避坑指南|这些坑别踩!踩了必挂
缓存击穿:热门视频空缓存Key,用分布式锁控制仅一个请求回源建缓存,其他请求等待,避免缓存雪崩!

排序稳定性:热度公式要AB测试调参,既要给新评论曝光机会,又要留住高质量老评论,不然用户体验拉胯~

评论计数:video的comment_count在Redis用INCR异步更,再同步回DB,别让计数拖慢整个系统!

🚨 趋势押题预测|2026必考!命中率85%
    此处省略一万字......!!!!

💡 最后提醒:这道题+押题,建议关注、收藏反复看,字节二面/三面很大概率碰到,别等面试慌了才临时抱佛脚!
                     ~加好友工具搜索:【页页谈说说】,获取最新全集+押题集

#面试问题记录##大厂##面经##AI时代还有必要刷leetcode吗?#
全部评论
蹲个offer
1 回复 分享
发布于 04-16 15:30 广东

相关推荐

1.&nbsp;自我介绍2.&nbsp;项目介绍3.&nbsp;平常如何学习看/写博客、书、AI4.&nbsp;平常看过什么开源项目muduo网络库,libco,stl源码5.&nbsp;进程、线程、协程区别6.&nbsp;线程间通信方式?7.&nbsp;条件变量使用场景?互斥锁呢?8.&nbsp;学过的数据结构?栈和队列的区别?9.&nbsp;玩过什么游戏?时长最长的是哪个?时长最长的是王者最喜欢玩什么英雄?狄仁杰的一技能伤害范围判定怎么做?不知道,提了一嘴可能通过扇形半径圆心角判定10.&nbsp;为什么对游戏后端开发有兴趣11.&nbsp;常见的排序算法?nlogn的有?12.&nbsp;找最小的100个数据如何处理13.&nbsp;MySQL的数据引擎有哪些?有什么区别14.&nbsp;B+树了解吗?范围查找怎么实现的?叶子结点有什么特征?15.为什么索引选B+树?15.&nbsp;MySQL调优了解过吗?16.&nbsp;一个语句查询过慢怎么排查和处理?17.&nbsp;事务隔离级别有哪些?默认隔离级别是什么,它解决了什么问题?18.&nbsp;MySQL是怎么解决并发问题的?19.&nbsp;MySQL锁的类型有哪些?InnoDB默认锁级别是什么?20.&nbsp;I/O多路复用有哪些?它们之间有什么区别?epoll为什么效率最高?21.&nbsp;epoll的触发方式?有什么区别22.&nbsp;说说Reactor模型23.&nbsp;TCP三次握手。为什么三次?24.&nbsp;服务器有大量CLOSE_WAIT状态的TCP连接如何排查和处理?25.&nbsp;对考研考公看法26.&nbsp;用过的开发工具27.&nbsp;职业规划28.&nbsp;你的优缺点29.&nbsp;反问
点赞 评论 收藏
分享
评论
2
3
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务