用hadoop还是spark,麻烦老师给个简单的思路?
用hadoop还是spark,麻烦老师给个简单的思路?
用spark或者mr读hbase底层的hfile文件,生成新的hfile文件,然后再导入到新的hbase表
用hadoop或者spark都可以做
这两篇笔记里有mr的相关内容
http://hainiubl.com/topics/125
http://hainiubl.com/topics/126
这里有spark的hfile操作
http://hainiubl.com/topics/196
你可以了解下hive 映射HBASE