字段变化的表在大数据中如何存储 ?

问答 xiexie ⋅ 于 2017-12-22 14:16:16 ⋅ 最后回复由 青牛 2018-01-06 21:52:09 ⋅ 3852 阅读

现在有个需求就是 有张表,表的字段 有时候会增加 或者减少, 用大数据的话 采用什么方式合理。我想过用HBASE,但是考虑到后续需要对这些数据进行数据分析,HBASE在数据分析这块儿 又没有什么优势。所以有些顾虑,不知道朋友有什么好的方法没 。有知道的朋友还请指点下

成为第一个点赞的人吧 :bowtie:
回复数量: 7
  • 青牛 国内首批大数据从业者,就职于金山,担任大数据团队核心研发工程师
    2017-12-22 15:52:24

    你的需求是宽列存储,所以用hbase比较合适,对数据的分析用SQL形式的比较多,hbase的数据存储在hdfs上所以可以读取底层的hfile文件转生hive用的文件就可以实现SQL查询了,所以用数据量大又是宽表结构就用hbase吧
    当然hbase还有impala的解决方案

  • ling775000
    2018-01-06 11:54:17

    @青牛 我插一句,就是他表里面字段是可变的,非结构化的数据即使用hive去映射,能用sql进行数据分析清洗吗?

  • xiexie
    2018-01-06 14:16:49

    恩恩。@青牛 ,就是。存到 Hbase里面的数据字段是变化的。非结构的数据也能在 hive中映射成表嘛 ?

  • 青牛 国内首批大数据从业者,就职于金山,担任大数据团队核心研发工程师
    2018-01-06 21:26:10

    @ling775000 既然用到sql那你必须知道是什么字段,如果字段变化太多可以用hive的map类型做映射

  • 青牛 国内首批大数据从业者,就职于金山,担任大数据团队核心研发工程师
    2018-01-06 21:28:10

    @xiexie 非结构化的数据,映射成hive的map类型吧

  • ling775000
    2018-01-06 21:29:11

    @青牛 那平时非结构化数据怎么进行数据清洗,数据分析呢

  • 青牛 国内首批大数据从业者,就职于金山,担任大数据团队核心研发工程师
    2018-01-06 21:52:09

    @ling775000 清洗之后转成结构化数据喽,然后才能分析起来方便

暂无评论~~
  • 请注意单词拼写,以及中英文排版,参考此页
  • 支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`, 更多语法请见这里 Markdown 语法
  • 支持表情,可用Emoji的自动补全, 在输入的时候只需要 ":" 就可以自动提示了 :metal: :point_right: 表情列表 :star: :sparkles:
  • 上传图片, 支持拖拽和剪切板黏贴上传, 格式限制 - jpg, png, gif,教程
  • 发布框支持本地存储功能,会在内容变更时保存,「提交」按钮点击时清空
Ctrl+Enter