iamabug

第 3859 位会员
注册于 2019-10-31 13:30:03
活跃于 2019-12-23 16:50:47


  • HDFS 存储数据占用多少硬盘空间? at 2019-10-31 15:13:43

    3T,三个副本不是指除了原本的数据还有三个副本,而是每份数据存储三份,三份数据之间互为副本,每一份数据都看做是一个副本,相当于冗余度是3。这种说法确实挺容易误解的。

    如果我的回答对你有帮助的话,可以关注我的公众号”大数据学徒“,一起交流学习。

  • 如何理解 hadoop 中数据块的概念? at 2019-10-31 13:42:14

    看一下HDFS数据目录下的文件结构:

    file

    这样看起来的话,hadoop中的block其实在实现上还是对应一个实际的文件,数据块是一个设计上的抽象概念(为了方便HDFS管理文件),这些文件的特殊之处在于元信息被HDFS管理,他们只有在HDFS中才有意义(因为它们只是一个HDFS文件的一部分)

    如果觉得有帮助的话,欢迎关注我的公众号”大数据学徒“哈~