数据量不大的情况下 你可以在driver端读数据然后分发到worker上
- spark 如何在 executor 端调用 sparksession?
- 请问如何分析 Hadoop 集群中,数据节点上 HDFS 占用的 CPU 和内存是多少?
- spark-submit 模式 yarn-cluster 部署,日志如何配置?
- hive 同步数据到 impala 的时候显示 impala 不能使用三个字符的分隔符,请问有什么办法?
- 为啥 Python 运算结果有.0?
- 如何配置 Linux 和 Kafka?
- JAVA 中 string 类型如何强制转化为 Date 类型?
- Java 怎么加密.class 文件?
- 现在有什么好的方案替换 zookeeper+ dubbo 吗?
- 为什么传统的 rdbms 不给每个表提供一个 counter 来计算每个表的行数呢?
- for 循环与 while 循环可以相互转换,为什么要有多种循环?
- 如何把 CloudWatch 上的 logs 传输到 MySQL 或 DynamoDB 数据库上进行分析?
- CQRS 架构中的 eventsource 有啥好的数据库可以实现?
- Hadoop 到底是干什么用的?
- 程序在本地运行和在 hadoop 集群上运行的区别?