春风亭老朝。
最近话题
- Hive 为什么每次启动都需要初始化元数据,不然会报错如下,怎么解决?
- spark collect (),当数据量比较大时,卡死怎么解决?
- kafka spring 如何发送的消息,他自己管理 zookeeper 吗?
- Kafka-spark-kafka-spark 架构有什么优势吗,为何两次使用 kafka?
- SparkStreaming 消费 kafka 数据,怎样解决大量初始化数据的问题?
- 如何解决 Spark 大规模数据运行情况下,速度越来越慢的情况?
- spark 如何实现一个快速的 RDD 中所有的元素相互计算?
- Spark 是一种内存计算引擎,为什么他还要依赖 HDFS 这种文件系统呢?
- spark 开发词频统计应用,最后数据保存到 Hadoop 下的 data 文件里?
- 大的文件拆分后,怎样用 Hadoop 进行高效的处理这些小文件?以及怎样让各个节点尽可能的负载均衡?
- 关系数据修改后如何刷新 Hadoop 平台数据?
- Hadoop 下 reduce 处理量最大是 1G 如果 order by 全局排序的文件超过 1G,系统如何处理?
- hadoop streaming 中 reduce 程序如何将结果保存在一个文件中输出?
- python 怎么设置 cuda 的随机数种子 curand?
- hadoop 环境搭建及开发的 jdk 版本问题?
- Hadoop 默认 map 数是 2,块大小 128M,当文件 为 512M 是会有几个 map,有几个 map 并行?
- 怎样用 kmeans 对类似 00101001110011001...这样的一连串序列进行聚类?
- Linux 平台完全分布模式下 Hadoop 实例 wordcount 在 eclipse 编写运行权限问题?
- spark 伪分布式模式的性能怎么样? 能否替换传统数据处理里的某些场景?
- spark 中 mllib 是如何将某些机器算法做到分布式并行计算的?
最新评论
-
信息被删除或无权限查看