问小白 wenxiaobai

资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

Hive分区详解：静态分区、动态分区与混合分区

创作时间:

作者:

@小白创作中心

Hive分区详解：静态分区、动态分区与混合分区

引用

CSDN

1.

https://m.blog.csdn.net/weixin_40121264/article/details/145661210

分区表

使用场景：数据量庞大且经常用来做查询的表
特点：将数据分别存储到不同的目录里
优点：避免全盘扫描，提高查询效率

分区的类型

它们的默认值分别是:

false
strict（要求至少有一个静态分区列）
nonstrict（允许所有分区列都是动态的）

1000：在每个 mapper 或 reducer 节点上允许创建的动态分区的最大数量。

注意: set 属性的修改只作用于当前会话

查看Hive中的属性设置
打开Hive命令行界面/Hue

示例>> 静态分区/动态分区

插入文件数据到静态分区(load data)
插入单条数据到静态分区(insert into )
从其他表插入数据到静态分区( insert into )

在 Hive 中，无论是静态分区还是动态分区，创建表时使用的 SQL 语句是相同的。这是因为分区的定义方式在表创建时是统一的，而分区的具体行为（静态或动态）是在数据插入时通过不同的操作来区分的。

静态分区：在插入数据时，分区值是明确指定的

LOAD DATA 命令: 将数据从文件直接加载到 Hive 表中，适用于批量导入数据文件, 文件中的数据必须与表的非分区列匹配
INSERT INTO 命令: 将数据从其他表或直接通过 VALUES 插入到目标表中，适合小规模数据插入或从其他表导入数据。

动态分区：在插入数据时，分区值是根据数据自动生成的

示例>>混合分区

在这个示例中：

year 是静态分区列，其值固定为 '2023'。
date 是动态分区列，其值从 source_table 中动态生成

Hive分区和Oracle分区的区别
oracle分区字段用的是表内字段；而hive分区字段采用表外字段。

临时表

是为数据提供一个临时的存储和转换空间，以便在将数据加载到目标表之前进行必要的处理或验证

完整分区过程

动态分区示例

第一步：先创建临时表
临时表包含目标表的所有字段及分区字段

第二步：导入数据到临时表
load data localinpath'./data/student2.txt'into tabletemp_part1;

静态分区示例

创建分区表
创建临时表
临时表需要包含目标表的所有字段（sid, name, gender, age, academy）以及分区字段（dt）

把数据加载到临时表
把临时表数据加载到目标表

混合分区示例

创建临时表
临时表需要包含目标表的所有字段（sid, name, gender, age, academy）以及分区字段（year, dt）：

将数据加载到临时表
插入数据到目标表

动态分区和静态分区代码的区别

在于数据插入时分区值的指定方式

静态分区在插入数据时需要明确指定分区值。这种方式适用于已知分区值的场景，可以减少数据加载时的动态分区处理开销。

动态分区在插入数据时，分区值是根据数据自动生成的。这种方式适用于分区值未知或变化较大的情景，可以提高数据管理的灵活性。

热门推荐

黄金市场暗访报告：标签规范、克重测量、旧金调换全解析

黄金市场暗访报告：标签规范、克重测量、旧金调换全解析

基于深度学习的复合薄膜气泡智能检测技术研究

基于深度学习的复合薄膜气泡智能检测技术研究

【非遗】酱油酿造技艺（先市酱油酿造技艺）

【非遗】酱油酿造技艺（先市酱油酿造技艺）

全球股市上演“过山车”行情，科技板块波动加剧，投资者如何应对？

全球股市上演“过山车”行情，科技板块波动加剧，投资者如何应对？

酱油－中国传统调味品

酱油－中国传统调味品

核心K线组合形态5：早晨之星（图解）

核心K线组合形态5：早晨之星（图解）

瓶装葡萄酒可以放几年不变质？红酒存放几年饮用最佳？

瓶装葡萄酒可以放几年不变质？红酒存放几年饮用最佳？

如何理解超额准备金在金融体系中的作用？这些准备金如何影响市场流动性？

如何理解超额准备金在金融体系中的作用？这些准备金如何影响市场流动性？

一片吐司的热量是多少？减肥期间可以吃吐司吗？

一片吐司的热量是多少？减肥期间可以吃吐司吗？

使用NodeLocal DNSCache提升Kubernetes集群DNS性能

使用NodeLocal DNSCache提升Kubernetes集群DNS性能

宜春铜鼓县规划建设20万亩高标准黄精种植基地打造百亿黄精产业

宜春铜鼓县规划建设20万亩高标准黄精种植基地打造百亿黄精产业

15个指标教你准确判断猫咪年龄

15个指标教你准确判断猫咪年龄

【收藏】叮！这份赡养老人个税专项附加扣除指南请查收！

【收藏】叮！这份赡养老人个税专项附加扣除指南请查收！

党史经典书籍推荐！这几本书，是学习党史绕不开的佳作

党史经典书籍推荐！这几本书，是学习党史绕不开的佳作

2025年复旦大学应用心理专硕招生信息解析

2025年复旦大学应用心理专硕招生信息解析

酒店擅自分装洗发水、沐浴露？涉嫌违法！

酒店擅自分装洗发水、沐浴露？涉嫌违法！

今日头条为何没有展现量？解析原因与解决方案

今日头条为何没有展现量？解析原因与解决方案

《中国医药》杂志刊发论文评价连花清瘟在呼吸系统疾病中的应用

《中国医药》杂志刊发论文评价连花清瘟在呼吸系统疾病中的应用

电动车全责交强险全赔吗

电动车全责交强险全赔吗

抗白三烯类药物有哪些

抗白三烯类药物有哪些

马东锡主演的五部动作片，拳拳到肉看点足，一部没看太遗憾！

马东锡主演的五部动作片，拳拳到肉看点足，一部没看太遗憾！

国家集采药靠谱！全国三甲医院真实世界研究给出答案

国家集采药靠谱！全国三甲医院真实世界研究给出答案

交强险死亡伤残赔偿项目包括哪些？

交强险死亡伤残赔偿项目包括哪些？

婚姻大事何必托付“情感军师”？警惕情感主播网络“卖拐”

婚姻大事何必托付“情感军师”？警惕情感主播网络“卖拐”

子产：春秋时期的杰出政治家与思想家

子产：春秋时期的杰出政治家与思想家

如何预防老人褥疮？江苏省人民医院专家给出专业建议

如何预防老人褥疮？江苏省人民医院专家给出专业建议

ChatGPT检测媒体偏见：潜力与局限性

ChatGPT检测媒体偏见：潜力与局限性

双向孔板流量计的校准与维护方式

双向孔板流量计的校准与维护方式

五险一金明细查询方法及常用问答

五险一金明细查询方法及常用问答

王者荣耀嬴政逆天出装，国服第一嬴政最强出装

王者荣耀嬴政逆天出装，国服第一嬴政最强出装

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号