首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
不拿offer不改名的chen呀
中国科学院大学 大数据开发工程师
发布于山西
关注
已关注
取消关注
@我的名字已被占用:
基于Flink的直播电商实时数仓建设(一)|背景及架构篇
本系列文章从生产实践的角度出发,分享一些直播电商实时数仓的建设思路及实践方法,给正在这方面探索的同学们提供一些经验和方法作为参考输入。相信大家对直播电商并不陌生,直播电商是基于直播的基础上诞生的新的商业模式。对于新的商业模式,大家有没有想过,如果自己负责建设公司的直播电商实时数据,会怎么建设呢?本系列文章主要介绍建设直播电商实时数据的关键步骤,如果对同学们有帮助的话,欢迎 点赞 + 收藏~ 1、建设背景 随着公司直播电商业务的发展,业务变得越来越复杂,营销活动也越来越多,在实时数据方面的诉求也越来越紧迫。如何快速有效地获取有价值、稳定的实时数据以帮助业务更好地进行产品迭代和支持运营及策略调整变得越来越重要和紧迫。有鉴于此,实时数仓也相应地提升建设优先级。 2、应用场景 实时OLAP分析:通过实时处理并将数据写入druid和ClickHouse等OLAP分析工具,提升OLAP时效性,使其具有较优的实时数据分析能力。实时数据看板:活动用的实时大屏数据展示需求。实时业务监控:公司核心指标实时监控。如订单指标、买家首页实时监控。实时数据接口服务:通过提供实时数据接口服务的方式,向其他业务线提供数据支持。如为推荐团队提供实时用户特征、直播间特征。实时ETL:实时消费数据进行清洗、转换、结构化处理用于下游计算处理。如为推荐团队提供商品曝光点击样品流、为商业化提供订单数据流。 3、建设目标 前面的建设背景和应用场景解释了建设实时数仓的必要性以及建设的收益点。假设你是该项目的主R,那么,在项目开始之前,你希望项目达到什么样的预期效果呢?我想这会是项目参与者和领导最关心的事情,所以,明确建设目标应该是一个前置动作。下面列举下我在「基于Flink的直播电商实时数仓建设」项目中期望的建设目标,接下来的系列文章也会围绕该建设目标展开叙述。小伙伴们也可以结合公司的建设现状进行借鉴和参考。设计一套体系化建设框架明确所需覆盖的业务过程,完成各层级数据规范化建设将通用的指标进行统一管理设计,明确口径定义、减少冗余开发、提升复用性对外输出可承诺的服务能力与标准 4、技术架构设计 好了,终于到了干货部分了。下面围绕直播电商实时数仓「数仓分层架构」和「技术架构」给大家展开介绍。 乍眼一看,是不是觉得和离线数仓的架构图,相差无几?其实二者差别还是很多的: 与离线数仓相比,实时数仓的层次更少一些从目前建设离线数仓的经验来看,数仓的数据明细层内容会非常丰富,处理明细数据外一般还会包含轻度汇总层的概念,另外离线数仓中应用层数据在数仓内部,但实时数仓中,app 应用层数据已经落入应用系统的存储介质中,可以把该层与数仓的表分离。应用层少建设的好处:实时处理数据的时候,每建一个层次,数据必然会产生一定的延迟。汇总层少建的好处:在汇总统计的时候,往往为了容忍一部分数据的延迟,可能会人为的制造一些延迟来保证数据的准确。举例,在统计跨天相关的订单事件中的数据时,可能会等到 00:00:05 或者 00:00:10 再统计,确保 00:00 前的数据已经全部接受到位了,再进行统计。所以,汇总层的层次太多的话,就会更大的加重人为造成的数据延迟。与离线数仓相比,实时数仓的数据源存储不同。在建设离线数仓的时候,目前公司整个离线数仓都是建立在 Hive 表之上。但是,在建设实时数仓的时候,同一份表,会使用不同的方式进行存储。比如常见的情况下,明细数据或者汇总数据都会存在 Kafka 里面,但是像商家、直播等维度信息需要借助 Hbase,MySQL 或者其他 KV 存储等数据库来进行存储。离线数仓建设的数据域也更丰富些,因为离线数仓的应用和分析场景比实时数仓丰富,所以对于基础数据建设的覆盖度要求比实时数仓要高。结合直直播电商的业务场景看,交易、营销、流量、内容这几个数据域的实时应用场景往往最多,因此建设优先级也往往是最高的。 技术架构图 在计算方面,采用的是Flink SQL+Flink Code的方式,原因是目前公司大数据平台的Flink SQL建设不完善,性能方面和Code相比仍有较大的优化空间。另外,一些复杂的逻辑处理仍需要使用Code。存储方面,采用Redis+Hbase。二者根据吞吐、时延要求按需使用。OLAP方面,采用的是Druid+ClickHouse。 下集预告 下集将分享直播电商实时数仓模型规范和实践细则 关于作者 作者就职于一线互联网公司负责离线、实时数据开发,每天支持处理千亿级别数据。坚持分享数仓理论、大数据开发技术干货,同时欢迎交流,关注公众号 "大数据开发指南",回复:“联系作者”,添加你身边那位懂数据的朋友。
点赞 0
评论 0
全部评论
推荐
最新
楼层
暂无评论,快来抢首评~
相关推荐
01-04 18:19
蓝禾技术_电商事业部_电商运营管培生(准入职员工)
蓝禾科技内推,蓝禾科技内推码
面经:蓝禾的流程推得很快,基本上投完两天就接到了hr的初试电话,直接进行了初试。初试全程大概三十分钟,hr小哥态度很和善。主要问了实践经历获奖的情况最有成就感的事情对电商运营的理解选择公司的标准等,都是比较常规的问题。禾你一起,做不可能的事 | 蓝禾26届校招启动啦公司介绍:蓝禾2008年成立于深圳,是一家集产品、设计、研发、品牌、营销、大数据运营于一体的创新型科技公司,旗下拥有图拉斯TORRAS、锐舞RANVOO、卡斯酷CASEKOO等多个品牌招聘岗位:运营(国内)、运营(国外)、营销、设计、研发技术、职能工作地点:深圳内推链接:https://lanhevip.jobs.feishu.cn...
点赞
评论
收藏
分享
今天 10:47
北京化工大学 Java
黑马SSM学习日记|day01
受到一位名叫程序员牛肉的前辈的影响,我开始写学习博客,主要目的是为了帮助自己巩固所学知识,与诸君共勉!先简单介绍一下本人情况。本人大三,目前学习了javase,javaweb,mysql,黑马点评,苍穹外卖,jvm,目前未找到实习,自己太拉了。但是在仅有的几次面试中,我发现了自己在看视频跟着学的时候,虽然能看懂,明白其中的弯弯绕绕,但是真正到自己上手做的时候,总是难以下手。总结来说,就是自己以为自己明白了,但是其实只是瞬时记忆,所以我想通过博客记录的方式来总结每天所学知识。SSM课程简介这套课程主要是为了讲清楚spring、springmvc、springboot、maven、mybatisp...
点赞
评论
收藏
分享
2025-12-25 20:19
南京邮电大学 Java
双非字节日常oc
有了一段实习终于敢投大厂了,回想起第一段实习,投的都是中小厂,找了几个月才找到,这次只用了一周,就顺利找到了,果然还是第一段实习最难找。商汤二面挂快手一面挂(两道算法都没a出来)字节三面oc今天也是顺利离职啦
爱写代码的木更:
恭喜恭喜,但是双非之间亦有差距
点赞
评论
收藏
分享
2025-11-26 02:29
北京虾皮信息科技有限公司_今日头条_前端工程师(准入职员工)
和女朋友一起北漂啦
女朋友签约了滴滴我签约了字节明年就可以开始北漂生活啦
尼公子的虾滑海鲜粥:
你好,举报在哪里,替我点一下
点赞
评论
收藏
分享
昨天 19:02
搜狐畅游_游戏策划工程师(准入职员工)
图拉斯内推,图拉斯内推码
面经:蓝禾的流程推得很快,基本上投完两天就接到了hr的初试电话,直接进行了初试。初试全程大概三十分钟,hr小哥态度很和善。主要问了实践经历获奖的情况最有成就感的事情对电商运营的理解选择公司的标准等,都是比较常规的问题。图拉斯2026届校招启动,今年HC翻倍,抓紧投递~【我们是】图拉斯(原蓝禾) 是一家集产品、设计、研发、品牌、营销和大数据运营于一体的创新型科技公司,总部位于中国深圳,全球员工规模超3000人。【base】深圳【岗位】运营(国内)、运营(国外)、营销、设计、研发技术、职能内推链接:https://lanhevip.jobs.feishu.cn/s/gAwh1MlZJsw内推码:H...
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
一大波手撕正在靠近!
1.7W
2
...
🔥2026创作新起点:《新年启航计划》来袭,三大赛道等你来冲!
1.5W
3
...
百度java一面 28届的第一次大厂面试 感觉g了
5804
4
...
测开劝退
3298
5
...
腾讯游戏后端一面
3296
6
...
27前端鼠鼠快手二面
3283
7
...
面试手撕题总结
2910
8
...
拥抱人机共生,锻造不可替代的“金头脑”
2910
9
...
双非老鼠的悲惨秋招
2846
10
...
实习不忙被公司要求下周再来
2763
创作者周榜
更多
正在热议
更多
#
26年哪些行业会变好/更差
#
7583次浏览
120人参与
#
实习,不懂就问
#
147176次浏览
1320人参与
#
去年的flag与今年的小目标
#
3837次浏览
112人参与
#
卷__卷不过你们,只能卷__了
#
2593次浏览
71人参与
#
有深度的简历长什么样?
#
8807次浏览
181人参与
#
哪些公司在招寒假实习?
#
3645次浏览
43人参与
#
入职第一天
#
5476次浏览
95人参与
#
你都用AI做什么
#
3325次浏览
90人参与
#
写论文的崩溃时刻
#
1877次浏览
55人参与
#
你不能接受的企业文化有哪些
#
4428次浏览
77人参与
#
一人分享一道面试手撕题
#
11454次浏览
563人参与
#
实习学到最有价值的工作习惯
#
54244次浏览
433人参与
#
你最满意的offer薪资是哪家公司?
#
64196次浏览
319人参与
#
应届生应该先就业还是先择业
#
161861次浏览
820人参与
#
外包能不能当跳板?
#
55967次浏览
260人参与
#
滴滴求职进展汇总
#
292699次浏览
2412人参与
#
你的实习什么时候入职
#
333233次浏览
2235人参与
#
帆软软件工作体验
#
8696次浏览
36人参与
#
校招第一份工作你干了多久?
#
132752次浏览
586人参与
#
秋招你被哪家公司挂了?
#
1002806次浏览
7711人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务