如果公司有实体集群就不会在docker上安装hadoop,因为hadoop自带资源管理模块yarn,所以没必要再用虚拟化技术
当然使用docker优点有很多比如:可以快速的搭建一个集群、增加、删除节点、实现资源隔离、快速复制任何想要的服务
缺点对于开发同学来讲使得程序的开发调试变得更困难一些了,因为又多了一层吗,当然运维同学就爽坏了。
- Docker 容器上部署 Hadoop?
- Hadoop 50070 端口没有监听?
- CDH 安装 MySQL 在那台机子上?
- Hadoop 50070 端口没有监听?
- 问下二次排序的使用场景有哪些?
- wordcount 执行不了,查日志提示 maximum-am-resource-percent is insufficient,应该怎么设置?
- 有 sparkSQL 了为啥还要 hive on spark 呢?
- 怎么对 hbase 中的数据进行清洗?
- spark 处理非结构化数据是怎么处理的?这个非结构化数据是怎么个数据能列举一下吗?
- map/reduce master 里的地址是用 mapred-site.xml 里的还是 yarn-site.xml 里的?
- map/reduce master 里的地址是用 mapred-site.xml 里的还是 yarn-site.xml 里的?
- map/reduce master 里的地址是用 mapred-site.xml 里的还是 yarn-site.xml 里的?
- 用 Linux 中 netcat 命令,客户端和服务端之间无法连接?
- ssm 中 jetty 运行报错?
- CDH 5.13.0 datanode 报错,有谁遇到过这个问题吗?