用数据平台根据项目要求,有的项目要求稳定性高就用,因为大数据平台做好了各组件集成就已经把兼容性问题解决了,这样会少很多麻烦。当然公司得额外花钱买这种平台,所以说一般不差钱图省事的公司都会用。当然很多公司都选择剩下这笔钱选择开源的自己去集成,然后再找专业的技术人员去弄。
存储数据量和内存 CPU关系小和硬盘关系大,NameNode节点内存给大点加上大硬盘就可以存储大量数据了,但是你其他节点内存和CPU少会算的慢但是不影响存
总数据量乘以三倍去评估存储空间,总CPU核或内存乘以2倍 取两者最大值去评估算力,所以自己根据单台机器的算力和存储去评估一下
- 在实际工作中多少数据量需要用到大数据平台?
- 集群?
- [下载] 海汼部落云平台 public 共享盘软件分享
- Hive 处理复杂逻辑时,SQL 里边需要创建临时表, 分段书写吗?还是有其他的方式处理逻辑。
- 平台资源是该了吗?
- [公告] 海汼部落新人必看
- 可以使用 XShell 连接云平台吗?
-
信息被删除或无权限查看
- [下载] Hadoop3 教程
- [下载] CDH 教程
- 学习?
-
信息被删除或无权限查看
-
信息被删除或无权限查看
-
信息被删除或无权限查看
-
信息被删除或无权限查看