海牛部落 hive 系列教程(二十):hive 数据类型、运算符、建库、建表

教程 青牛 ⋅ 于 2017-06-01 17:43:04 ⋅ 最后回复由 wz 2022-12-13 15:04:51 ⋅ 19642 阅读

1.hive的数据组织
基本概念和关系型数据库类似,如:库,表,列,分区。按照数据组织粒度由大到小说明:
数据库 Databases Database起到命名空间的功能,避免表,视图等定义的混乱,同时也为权限的定义及分配提供良好的隔离。
表 Tables 每个表包含一个主题信息,有多个属性字段组成的二维数据集合,一个数据库可以包含多张表。
分区 Partitions 每个表可以有一个或多个分区键值,是数据的存储单元,可以按分区key划分查询数据范围,有效提高查询效率。比如可以按月和按天设计表分区,查询是指定查某天则不需要扫描整月数据。
桶 Buckets 表分区还可以按照某几列hash进行划分,可以实现数据采样和提高某些场景的查询效率,如mapside join。

2.元数据库中相关表的解释
file
file

以下内容回帖刷新可见………………

回复帖子,然后刷新页面即可查看隐藏内容

版权声明:原创作品,允许转载,转载时务必以超链接的形式表明出处和作者信息。否则将追究法律责任。来自海汼部落-青牛,http://hainiubl.com/topics/112
回复数量: 86
暂无评论~~
  • 请注意单词拼写,以及中英文排版,参考此页
  • 支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`, 更多语法请见这里 Markdown 语法
  • 支持表情,可用Emoji的自动补全, 在输入的时候只需要 ":" 就可以自动提示了 :metal: :point_right: 表情列表 :star: :sparkles:
  • 上传图片, 支持拖拽和剪切板黏贴上传, 格式限制 - jpg, png, gif,教程
  • 发布框支持本地存储功能,会在内容变更时保存,「提交」按钮点击时清空
Ctrl+Enter