07-01 17:26 门头沟学院数据分析师发布于广东

关注

从入门到进阶：彻底吃透 Flink 中的 Watermark 和事件时间处理！(阿里云大数据面试）

第一章：流处理的时间维度，究竟是怎么一回事？

在批处理的世界里，时间好像并不重要。数据是一次性全部读取的，处理的顺序是确定的。但一进入流处理的领域，时间就变得特别关键，甚至可以说，流处理=数据+时间。而在Apache Flink这个强大的流处理框架中，时间的概念更是整个运行时引擎的基石。

我们通常在流处理场景中，会涉及三种时间：

事件时间（Event Time）：数据在实际发生时的时间戳（通常由设备或业务系统打上）。
摄取时间（Ingestion Time）：数据进入Flink系统的时间。
处理时间（Processing Time）：Flink所在机器当前的系统时间。

为什么要区分这三种时间？

举个简单的例子，如果你在做用户行为分析，一个用户在2025-06-01 08:00:00点击了“购买”按钮，但由于网络延迟，这条事件直到08:00:05才进入Flink系统，那么事件时间就是08:00:00，摄取时间是08:00:05，处理时间可能是08:00:06。

显然，如果你要做某种10分钟滚动窗口的计算，你是希望按照用户真实点击时间来归类的，这就是为什么事件时间在复杂流处理逻辑中才是真正王道。

不过——说到这里，不得不提个“坏消息”：现实中的数据从不听话。

第二章：乱序事件的挑战 —— 理想很丰满，现实很骨感

事件时间听起来很美好，但真实世界的数据流，可不会乖乖地按顺序排队来。

比如同一个设备采集的事件：

event1：timestamp = 08:00:01
event2：timestamp = 08:00:04
event3：timestamp = 08:00:03

你没看错，event3 是晚到的，典型的乱序数据。

如果你用事件时间来做计算，比如每5秒钟一个窗口，你就会面临一个严重的问题：数据到底什么时候算“到齐”了？

第三章：Watermark初探 —— 让时间流动起来

Watermark 是 Flink 中用于处理事件时间的核心机制。

什么是 Watermark？

一句话解释：Watermark 是系统对事件时间进度的推测。

换种说法，它告诉Flink：“我认为，时间戳 <= X 的数据差不多都到齐了，你可以安全地触发相应计算了。”

这意味着：Watermark 并不是时间戳，而是一种系统主观判断的机制。

Watermark 是如何产生和传播的？

通常来说，Watermark 是由 Source（数据源）生成的，并且沿着 DataStream 向下游传播。

Flink 中典型的方式是：

DataStream<Event> stream = ...;
stream.assignTimestampsAndWatermarks(
    WatermarkStrategy
        .<Event>forBoundedOutOfOrderness(Duration.ofSeconds(5))
        .withTimestampAssigner((event, timestamp) -> event.getTimestamp())
);

上面这段代码意思是：我知道我的事件可能最多晚来5秒钟，所以我可以容忍5秒的乱序。

比如，当前观察到的最大事件时间是 08:00:10，那么 Watermark 就是 08:00:10 - 00:00:05 = 08:00:05。

当 Watermark 推进到某个点时，就意味着窗口或某些基于时间的操作可以触发计算了。

为什么 Watermark 是“保守”的？

因为你永远不能确定未来有没有更早的事件还在路上，所以 Flink 设计得很保守。它宁可等一等，也不愿意错过数据。

这种保守也意味着：

处理延迟可能上升。
窗口计算触发会变慢。
但是！准确性更高。

第四章：窗口触发机制中的 Watermark 角色

在 Flink 中，最常见的时间计算操作就是窗口，比如 tumbling（滚动）窗口、sliding（滑动）窗口、session（会话）窗口。

比如说一个 10 秒滚动窗口，按事件时间划分：

窗口1：08:00:00 - 08:00:10
窗口2：08:00:10 - 08:00:20
...

Flink 会等到 Watermark >= 窗口结束时间，才触发窗口计算。

所以如果 Watermark 是 08:00:09，那么第一个窗口不会触发。

而一旦 Watermark 达到 08:00:10，就意味着 Flink 认为“08:00:00 - 08:00:10”之间的事件差不多到齐了，于是窗口触发。

这一特性对于精确计算延迟事件非常关键。

第五章：自定义 Watermark 策略——与乱序和解的艺术

很多时候，预定义的乱序容忍策略并不能完全适配业务实际。

比如有些数据源的延迟特别严重，有些则基本准时。

这时候，你就可以实现自己的 WatermarkGenerator。

自定义 WatermarkGenerator 示例

WatermarkStrategy<Event> strategy = WatermarkStrategy
    .<Event>forGenerator(ctx -> new WatermarkGenerator<Event>() {

        private long maxTimestampSeen = Long.MIN_VALUE;
        private final long maxOutOfOrderness = 5000; // 5秒

        @Override
        public void onEvent(Event event, long eventTimestamp, WatermarkOutput output) {
            maxTimestampSeen = Math.max(maxTimestampSeen, eventTimestamp);
        }

        @Override
        public void onPeriodicEmit(WatermarkOutput output) {
            output.emitWatermark(new Watermark(maxTimestampSeen - maxOutOfOrderness));
        }
    })
    .withTimestampAssigner((event, timestamp) -> event.getTimestamp());

上面的代码展示了典型的“观察最大时间戳+固定延迟”的策略。

你甚至可以根据业务规则，比如某种字段值、某类事件类型、甚至外部指标，动态调整 maxOutOfOrderness。

延迟太大怎么办？

可以设置允许延迟事件的时间范围，例如使用 allowedLateness()：

.window(TumblingEventTimeWindows.of(Time.seconds(10)))
.allowedLateness(Time.seconds(30))

配合侧输出流 SideOutput 接收迟到事件：

.windowAll(...)
.sideOutputLateData(lateTag)

这些机制可以最大程度减少“迟到就丢”的损失，同时也对系统资源消耗提出了挑战。

第六章：并行度与Watermark的“协奏曲”

现实世界中的数据流可不只有一个 Source。为了扩展处理能力，Flink 天然支持并行计算，即一个 Operator 可以有多个并行子任务（subtask），每个处理自己那一份数据流分片。那么问题来了：多个子任务发出的 Watermark，要怎么统一？

水位线的“取最小”原则

Flink 的 Watermark 合并机制是取所有并行子任务中最小的那个 Watermark，作为整个 Operator 的全局 Watermark。

这个设计虽然听起来“拖后腿”，但其实非常合理：只要有一个子任务的数据还没到齐，整个系统就不能贸然推进时间。

举个例子：

Subtask 0：Watermark = 08:00:10
Subtask 1：Watermark = 08:00:12
Subtask 2：Watermark = 08:00:08

那么整个 Operator 的有效 Watermark 就是 08:00:08。这就是所谓的“最小水位决定论”。

为什么不取最大、平均？

取最大：会导致窗口过早触发，丢失延迟事件。
取平均：没有实际意义，不能保证任何一个分区的数据都到齐。

所以，保守地取最小值是最安全的选择。

如何应对部分分区“卡住”不发水位的情况？

某些数据源可能因为没数据，Watermark 不更新，导致整个任务进度被阻塞。

解决办法：使用 withIdleness() 标记空闲输入流。

Waterma

剩余60%内容，订阅专栏后可继续查看/也可单篇购买

大数据从入门到精通-最全面试题文章被收录于专栏

17年+码农经历了很多次面试，多次作为面试官面试别人，多次大数据面试和面试别人，深知哪些面试题是会被经常问到。在多家企业从0到1开发过离线数仓实时数仓等多个大型项目，详细介绍项目架构等企业内部秘不外传的资料，介绍踩过的坑和开发干货，分享多个拿来即用的大数据ETL工具，让小白用户快速入门并精通，指导如何入职后快速上手。计划更新内容100篇以上，包括一些企业内部秘不外宣的干货，欢迎订阅！