了解 HDFS 吗,介绍下HDFSHSDF 是 Hadoop 生态的一个组件,它是一个分布式文件系统。它将数据进行切分,存储在若干台机器上。它的出现解决了独立机器存储大数据集的压力HDFS 的特点及应用场景适合存储大文件HDFS支持 GB 级别甚至 TB 级别的文件,它会把大文件切分成若干个块存储在不同的节点上,在进行大文件读写时采用并行的方式提高数据的吞吐量。容错性高HDFS有多副本机制,它会自动保存副本到不同的节点。即使有一台节点宕机了也不会丢失数据。适用于读多写少场景HDFS中的文件支持一次写入、多次读取,写入操作是以追加的方式(append)添加在文件末尾,不支持对文件的任意位置进行修...