资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

SQL优化——如何高效添加数据

创作时间:

作者:

@小白创作中心

SQL优化——如何高效添加数据

引用

来源

https://cloud.tencent.com/developer/article/2402696

在数据库操作中，高效地添加数据是提升系统性能的关键。本文将详细介绍几种优化方案，包括批量插入、手动控制事务、主键顺序插入以及使用LOAD指令。同时，本文还将深入探讨主键优化的原理，帮助读者理解为什么主键顺序插入的性能优于乱序插入。

SQL优化

高效添加数据的几种方式

普通插入（Insert语句）

先回顾一下向数据库中添加数据的基本操作：

当我们想要向数据库中的表tb中插入一条数据时，可以采用insert into语句：

insert into tb values(1,'value1');

当我们想要向数据库插入多条数据时，可以执行多条insert into语句：

insert into tb1 values(1,'value1');
insert into tb2 values(2,'value2');
insert into tb3 values(3,'value3');

但是当想插入数据很多时，行数会非常密集，而且代码要多次请求数据库，每次请求都会消耗一定的性能，要怎样进行优化呢？

优化方案1：批量插入

一般情况下都采用批量插入来使得添加数据更高效
批量插入的思想就是把多行数据压缩成一行，只需要远程请求一次数据库，且代码更加简洁
但是一次性批量插入的数据建议控制在500条之内，如果多于500条，则应该分多个批次处理

Insert into tb values(1,'value1'),(2,'value2'),(3,'value3');

优化方案2：手动控制事务

通过手动控制事务添加数据有多种好处
一般情况下，MySQL自动为每条插入语句创建一个事务，这样可能会导致大量的日志记录，从而降低系统性能。通过手动控制事务，可以将多条执行单元合并为一个事务，从而避免了多个事务的开销。
手动控制事务可以帮助我们保证数据的完整性和一致性。

反例：

Insert into tb values(1,'value1'),(2,'value2'),(3,'value3');
Insert into tb values(4,'value1'),(5,'value2'),(6,'value3');
Insert into tb values(7,'value1'),(8,'value2'),(9,'value3');

正例：

start transaction;
Insert into tb values(1,'value1'),(2,'value2'),(3,'value3');
Insert into tb values(4,'value1'),(5,'value2'),(6,'value3');
Insert into tb values(7,'value1'),(8,'value2'),(9,'value3');
commit;

优化方案3：主键顺序插入

不管数据量如何，推荐采用主键顺序插入来添加数据。
主键顺序插入，性能要高于乱序插入。原理见后续的主键优化部分。

#主键乱序插入 : 6 2 9 7 2  
#主键顺序插入 : 1 2 4 6 8

优化方案4：load指令添加数据

如果一次性需要插入大批量数据(比如几百万的记录)，使用insert语句可能需要花费几十分钟，此时可以使用MySQL数据库提供的load指令，这个过程只需要花费几十秒。

如何采用load指令大批量添加数据？

如果是常规的连接数据库，只需要输入以下指令：

mysql -u root -p

如果需要用load指令，需要额外添加-local-infile参数：

mysql –-local-infile -u root -p

设置全局参数local_infile为1，开启从本地加载文件导入数据的开关：

set global local_infile = 1;

我们也可以事先通过以下指令来查看local_infile全局参数是否开启：
如果local_infile显示为0，则表示开关并未开启，则需要手动设置为1。

select @@local_infile;

结果显示如下：

举个栗子：

假设要上传100万条数据，要上传的文件路径是'/root/load_user_100w_sort.sql'，则往表tb1中添加数据的完整load指令是：

load data local infile '/root/load_user_100w_sort.sql' into table tb1 fields terminated by ',' lines terminated by '\n' ;

其中，
load data local infile是固定格式；
into table tb1表示向表tb1添加数据；
fields terminated by ','表示每一个字段之间采用逗号分割；
lines terminated by '\n'表示每一行之间采用换行符分割。

主键优化的原理

为什么主键顺序插入的性能要大于乱序插入？

首先了解在InnoDB存储引擎中数据的组织方式：在InnoDB存储引擎中，表数据都是根据主键顺序组织存放的，这种存储方式的表称为索引组织表。
在索引组织表中，页是InnoDB磁盘管理的最小单元，其固定大小为16K。页可以为空，也可以填充一半，也可以填充满。每个页至少包含2行数据(如果只包含一行数据则是链表结构；如果一行数据过大超过阈值会导致行溢出)，根据主键排列。