Kudu对比hive性能要高很多且支持数据更新,还有一个好处是c++开发的相比java没有了GC延迟时间。在上层,可以用 Impala 查询,也可以使用其他的 SQL on Hadoop 进行查询,SparkSQL 之类的,能很好地融入 Hadoop 生态。而且接口和hbase很像也有scan等。如果你需要对实时数据做查询,如果需要快速地查询,那么 Kudu 无疑是一个好的选择。
Impala只是操作Kudu的一个终端吧,能操作Kudu的有挺多比如刚才说的spark-sql。好处就是都是Cloudera开发的Impala与Kudu兼容性比较好吧
- Impala 需要与 Kudu 表结合使用吗?
- 为啥我的 sparksql 加了 where 不管用呢?
- 海牛部落 Linux 系列教程:(5) 用户与用户组管理
- 海牛部落 Linux 系列教程:(5) 用户与用户组管理
- 海牛部落 Linux 系列教程:(5) 用户与用户组管理
- Hbase 如何用 javaAPI 列出列族及字段名?
- 海牛部落 hbase 系列教程(二十八):hbase 的 filter 用法,hbase 数据的批量导入
- Hbase 如何用 javaAPI 列出列族及字段名?
- Llama 角色存在,但没有设置 YARN 依赖关系?
- 后台程序如何调用 hive?
- 后台程序如何调用 hive?
- 提问关于 5 分钟数据存储的问题?
- 提问关于 5 分钟数据存储的问题?
- 后台程序如何调用 hive?
- 提问关于 5 分钟数据存储的问题?