大数据工程师面试 Flink 知识点 - 时间语义

1. Flink时间语义的理解

Flink提供了三种时间语义,以满足不同计算场景的需求:处理时间,事件时间和注入时间。

•处理时间(Processing Time):一种直观的时间语义,表示数据进入算子并开始处理的实际时间点。•事件时间(Event Time):表示事件实际发生的时间,通常在消息的时间戳字段中找到。由于可能会有数据乱序的问题,但它能保证精确度高的计算场景。•注入时间(Ingestion Time):介于处理时间和事件时间之间的折中选择,代表数据进入Flink处理系统的时间。这方面的细节问题较少被询问。

2. 理解时间语义的应用场景和优势

每种时间语义都有其独特的使用场景和优势。

•处理时间:适用于对时间顺序不敏感的应用,由于无需跟踪或等待事件的发生时间,可以更简单快速的处理。•事件时间:适用于精确计数的场景,如数据重放过程中,事件时间可以确保数据的窗口计算不出错。•注入时间:这个应用场景较少,与处理时间相比较类似。

3. Flink 的 Watermark 应该如何使用?

在 Apache Flink 中,watermark (水印)是用来处理被延迟和乱序的事件时间戳数据。通过设置和使用 watermark,可以允许 Flink 的时间窗口延迟关闭和计算,直到收到的 watermark 时间戳大于窗口的结束时间。这就意味着只有我们确定所有早于 watermark 时间的数据都已经处理了,才会触发窗口的计算。 当处理流数据时,首选需要指定使用事件时间语义,并提供自定义的 watermark 生成器。在 Flink 的 DataStream API 中,可以使用 assignTimestampsAndWatermarks 方法来指定 watermark 生成逻辑。例如:

StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();env.setStreamTimeCharacteristic(TimeCharacteristic.EventTime);DataStream<MyEvent> stream = env.addSource(new MyEventSource());DataStream<MyEvent> withTimestampsAndWatermarks =    stream.assignTimestampsAndWatermarks(new MyAssigner());

在上述代码中,MyAssigner 就是我们自定义的 watermark 生成器。实现这个生成器需要重写两个方法:extractTimestamp 提取事件的时间戳,getCurrentWatermark 生成 watermark。

有大数据面试相关问题欢迎评论区提问或者找我交流!

#大数据##大数据工程师##大数据知识体系##大数据面试##大数据面经#

解决职场真实面试问题,分享同学真实成功案例,欢迎订阅关注!

全部评论

相关推荐

2025-12-12 19:58
哔哩哔哩_产品运营
跟同事聊天时候,同事说“你刚来时候blabla”,突然意识到自己已经正式工作一年多了!就这么从脆皮内耗大学生逐渐磨练成厚血条(厚脸皮)工位主理人。秋招简历当然也是投了不少份,但总有一些机会要留给自己的白月光,比如阿B,说说我秋招选择阿B的理由吧:1.&nbsp;“为爱发电”:说来兴趣真的是初心,阿B在手机陪我看了那么多番剧vlog学习视频,当然想和它距离更近一些。来了之后发现,B站重要活动要专门走内宣是有原因的,身边的六级大佬绝对不在少数。2.&nbsp;实习体验感拉满:嗯对其实等不到正式工作就先来实习体验了。实习期在一个非常好的组,大家都很年轻氛围超好,做事情讲背景、讲逻辑不会只丢脏活累活。平时聊得来,工作起来也能快速打配合,项目完成时候所有人都成就感满满。再说说来正式工作之后的体验感:1.&nbsp;校招生mentor文化很需要:在阿B每个校招生入职都是会有一位mentor的,不会让大家有刚工作人生地不熟就孤苦一人挑大梁的感觉。很幸运我的mt人真的超好,耐心温柔业务能力又很强。常常在对需求听她帮我说话时看着她身上闪耀的光芒想要流泪。有mt的话landing期会顺畅很多。公司也会安排一些活动帮助mentor和mentee增进感情。2.小动物们和各类活动是回血剂:工作起来当然难免遇到一些磕磕磨磨,但是压力大时候转头看到想悄悄溜过的小猫摸上一把,真的会治愈不少。还有节假日的各种活动和扫楼活动,真的会给上班增加动力。最后上图!没有任何工作会让人一直开心吧,但阿B你在照顾员工心情这一块儿做得真的很不错。
哔哩哔哩公司福利 915人发布
点赞 评论 收藏
分享
评论
1
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务