正文抽取中 hbase 的 rowkey 过长问题?

问答 螺旋的邂逅 ⋅ 于 2021-04-16 17:03:32 ⋅ 最后回复由 青牛 2021-04-17 01:27:03 ⋅ 1352 阅读

正文进入Hbase的rowkey设计是url+time+md5,发现rowkey过长大大影响查询速度,这个怎么解决?有什么好的调优方法吗?

成为第一个点赞的人吧 :bowtie:
回复数量: 3
  • 青牛 国内首批大数据从业者,就职于金山,担任大数据团队核心研发工程师
    2021-04-16 19:53:08

    是host_time_md5。这个没多长吧,不是url+time+md5

  • 螺旋的邂逅
    2021-04-16 21:03:46

    @青牛 md5不是挺长的么,一个MD5感觉就有16字节了,不是违背那个rowkey设计原则了么

  • 青牛 国内首批大数据从业者,就职于金山,担任大数据团队核心研发工程师
    2021-04-17 01:27:03

    @螺旋的邂逅 不超过150就行

暂无评论~~
  • 请注意单词拼写,以及中英文排版,参考此页
  • 支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`, 更多语法请见这里 Markdown 语法
  • 支持表情,可用Emoji的自动补全, 在输入的时候只需要 ":" 就可以自动提示了 :metal: :point_right: 表情列表 :star: :sparkles:
  • 上传图片, 支持拖拽和剪切板黏贴上传, 格式限制 - jpg, png, gif,教程
  • 发布框支持本地存储功能,会在内容变更时保存,「提交」按钮点击时清空
Ctrl+Enter