存储在namenode节点的硬盘和内存中
- HDFS 全部文件的元数据是存储在 namenode 节点的硬盘还是内存?
 - Spark updateStageByKey 产生的大量 checkpoint 小文件在 hdfs 上怎么处理?
 - 
          信息被删除或无权限查看
 - 
          信息被删除或无权限查看
 - 
          信息被删除或无权限查看
 - 怎样用 kmeans 对类似 00101001110011001...这样的一连串序列进行聚类?
 - spark 中 mllib 是如何将某些机器算法做到分布式并行计算的?
 - spark 伪分布式模式的性能怎么样? 能否替换传统数据处理里的某些场景?
 - Linux 平台完全分布模式下 Hadoop 实例 wordcount 在 eclipse 编写运行权限问题?
 - Fuzzy C-means 与 Gaussian Mixture Model 聚类的区别?修改
 - Spark 中的 CNN 如何实现分布式计算的?
 - spark streaming 任务如何切分,是按照 duration 切分么?
 - Spark SQL 如何管理 select 权限,貌似任何用户都可以查询任何一张表?
 - 
          信息被删除或无权限查看
 - spark 读取 hive 的问题?