滴滴大数据面试题汇总(持续更新)

  1. Spark Streaming面试题

    • 什么是Spark Streaming?它与Spark有什么不同?
    • Spark Streaming如何处理离线数据?
    • 什么是DStream(离散数据流)?如何创建一个DStream?
    • 什么是RDD(弹性分布式数据集)?
    • 如何将已有的RDD转换为DStream?
    • 过滤器转换器(Filter Transformers)是什么?在Spark Streaming中有哪些可用的过滤器转换器?
    • 什么是窗口操作?如何使用它们?
    • 什么是输出操作?在Spark Streaming中有哪些可用的输出操作?
    • 你在处理数据时遇到了内存问题,你该如何处理?
    • 在处理数据时,你发现处理速度很慢,你该如何优化它?
    • Spark Streaming在哪些行业中得到广泛应用?
    • 什么是数据重复?Spark Streaming如何处理重复数据?
    • 什么是延迟(Latency)?如何减少延迟?
    • Spark Streaming与Kafka的集成是如何实现的?
    • Spark Streaming可以如何处理实时大数据处理的问题?
    • 什么是数据突发(Data Spikes)?如何处理突发的数据流?
    • 什么是容错性(Fault Tolerance)?Spark Streaming如何保证容错性?
    • 什么是累加器(Accumulators)?在Spark Streaming中有哪些可用的累加器?
    • 批处理和实时处理有什么区别?Spark Streaming是批处理还是实时处理?
    • 什么是Spark应用程序?如何使用Spark应用程序?
  2. 滴滴数据开发面试题

    • 4道SQL题,主要是关于实际业务问题,涉及多个表的子查询和一些函数。
    • join中条件写on和where里面的区别。
    • MapReduce过程中的溢写过程是什么样?
    • 数据倾斜是什么?容易发生在Map段的哪个部分,应该怎么处理数据倾斜的问题?
    • 会不会Spark,Spark和MapReduce的区别,为什么Spark比MapReduce快?
  3. 滴滴校招面试真题

    • 给定一个整数数组,求该数组中任意两个不同元素之间的最大差值。
  4. 滴滴核心数仓面试题

    • SLA破线怎么预防和感知?

**********************

#大数据面试题##滴滴#
全部评论

相关推荐

鬼迹人途:你去投一投尚游游戏,服务器一面,第一个图算法,做完了给你一个策略题,你给出方案他就提出低概率问题,答不上当场给你挂
点赞 评论 收藏
分享
评论
1
9
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务