TDengine 数据写入SQL
TDengine 数据写入SQL
TDengine数据库提供了两种主要的数据写入方式:通过SQL语句写入和通过参数绑定的STMT高速写入。本文将详细介绍最基本的SQL写入语法,包括正常语法和超级表语法,并通过具体示例说明各种写入场景和注意事项。
写入语法
写入记录支持两种语法:正常语法和超级表语法。正常语法下,紧跟INSERT INTO后的表名是子表名或者普通表名。超级表语法下,紧跟INSERT INTO后的表名是超级表名。
正常语法
INSERT INTO
tb_name
[USING stb_name [(tag1_name, ...)] TAGS (tag1_value, ...)]
[(field1_name, ...)]
VALUES (field1_value, ...) [(field1_value2, ...) ...] | FILE csv_file_path
[tb2_name
[USING stb_name [(tag1_name, ...)] TAGS (tag1_value, ...)]
[(field1_name, ...)]
VALUES (field1_value, ...) [(field1_value2, ...) ...] | FILE csv_file_path
...];
INSERT INTO tb_name [(field1_name, ...)] subquery
超级表语法
INSERT INTO
stb1_name [(field1_name, ...)]
VALUES (field1_value, ...) [(field1_value2, ...) ...] | FILE csv_file_path
[stb2_name [(field1_name, ...)]
VALUES (field1_value, ...) [(field1_value2, ...) ...] | FILE csv_file_path
...];
主键时间戳
TDengine要求插入的数据必须要有时间戳,插入数据的时间戳要注意以下几点:
- 时间戳不同的格式语法会有不同的精度影响。字符串格式的时间戳写法不受所在DATABASE的时间精度设置影响;而长整形格式的时间戳写法会受到所在DATABASE的时间精度设置影响。例如,时间戳"2021-07-13 16:16:48"的UNIX秒数为1626164208。则其在毫秒精度下需要写作1626164208000,在微秒精度设置下就需要写为1626164208000000,纳秒精度设置下需要写为1626164208000000000。
- 一次插入多行数据时,不要把首列的时间戳的值都写NOW。否则会导致语句中的多条记录使用相同的时间戳,于是就可能出现相互覆盖以致这些数据行无法全部被正确保存。其原因在于,NOW函数在执行中会被解析为所在SQL语句的客户端执行时间,出现在同一语句中的多个NOW标记也就会被替换为完全相同的时间戳取值。
- 允许插入的最大时间戳为当前时间加上100年,比如当前时间为2024-11-11 12:00:00,则允许插入的最大时间戳为2124-11-11 12:00:00。允许插入的最小时间戳取决于数据库的KEEP设置。企业版支持三级存储,可以设置多个KEEP时间,如下图所示,如果数据库的KEEP配置为100h,100d,3650d,则允许的最小时间戳为当前时间减去3650天。那么时间戳在[Now - 100h, Now + 100y)内的会保存在一级存储,时间戳在[Now - 100d, Now - 100h)内的会保存在二级存储,时间戳在[Now - 3650d, Now - 100d)内的会保存在三级存储。社区版不支持多级存储功能,只能配置一个KEEP值,如果配置多个,则取其最大者。如果时间戳不在有效时间范围内,TDengine将返回错误“Timestamp out of range”。
语法说明
- 可以指定要插入值的列,对于未指定的列数据库将自动填充为NULL。
- VALUES语法表示了要插入的一行或多行数据。
- FILE语法表示数据来自于CSV文件(英文逗号分隔、英文单引号括住每个值),CSV文件无需表头。如仅需创建子表,请参考’表’章节。
- INSERT ... VALUES语句和INSERT ... FILE语句均可以在一条INSERT语句中同时向多个表插入数据。
- INSERT语句是完整解析后再执行的,对如下语句,不会再出现数据错误但建表成功的情况:
INSERT INTO d1001 USING meters TAGS('Beijing.Chaoyang', 2) VALUES('a');
- 对于向多个子表插入数据的情况,依然会有部分数据写入失败,部分数据写入成功的情况。这是因为多个子表可能分布在不同的VNODE上,客户端将INSERT语句完整解析后,将数据发往各个涉及的VNODE上,每个VNODE独立进行写入操作。如果某个VNODE因为某些原因(比如网络问题或磁盘故障)导致写入失败,并不会影响其他VNODE节点的写入。
- 主键列值必须指定且不能为NULL。
正常语法说明
- USING子句是自动建表语法。如果用户在写数据时并不确定某个表是否存在,此时可以在写入数据时使用自动建表语法来创建不存在的表,若该表已存在则不会建立新表。自动建表时,要求必须以超级表为模板,并写明数据表的TAGS取值。可以只是指定部分TAGS列的取值,未被指定的TAGS列将置为NULL。
- 可以使用INSERT ... subquery语句将TDengine中的数据插入到指定表中。subquery可以是任意的查询语句。此语法只能用于子表和普通表,且不支持自动建表。
超级表语法说明
- 在field_name列表中必须指定tbname列,否则报错. tbname列是子表名, 类型是字符串. 其中字符不用转义, 不能包含点‘.’
- 在field_name列表中支持标签列,当子表已经存在时,指定标签值并不会触发标签值的修改;当子表不存在时会使用所指定的标签值建立子表. 如果没有指定任何标签列,则把所有标签列的值设置为NULL
- 不支持参数绑定写入
插入一条记录
指定已经创建好的数据子表的表名,并通过VALUES关键字提供一行或多行数据,即可向数据库写入这些数据。例如,执行如下语句可以写入一行记录:
INSERT INTO d1001 VALUES (NOW, 10.2, 219, 0.32);
插入多条记录
或者,可以通过如下语句写入两行记录:
INSERT INTO d1001 VALUES ('2021-07-13 14:06:32.272', 10.2, 219, 0.32) (1626164208000, 10.15, 217, 0.33);
指定列插入
向数据子表中插入记录时,无论插入一行还是多行,都可以让数据对应到指定的列。对于SQL语句中没有出现的列,数据库将自动填充为NULL。主键(时间戳)不能为NULL。例如:
INSERT INTO d1001 (ts, current, phase) VALUES ('2021-07-13 14:06:33.196', 10.27, 0.31);
向多个表插入记录
可以在一条语句中,分别向多个表插入一条或多条记录,并且也可以在插入过程中指定列。例如:
INSERT INTO d1001 VALUES ('2021-07-13 14:06:34.630', 10.2, 219, 0.32) ('2021-07-13 14:06:35.779', 10.15, 217, 0.33)
d1002 (ts, current, phase) VALUES ('2021-07-13 14:06:34.255', 10.27, 0.31);
插入记录时自动建表
如果用户在写数据时并不确定某个表是否存在,此时可以在写入数据时使用自动建表语法来创建不存在的表,若该表已存在则不会建立新表。自动建表时,要求必须以超级表为模板,并写明数据表的TAGS取值。例如:
INSERT INTO d21001 USING meters TAGS ('California.SanFrancisco', 2) VALUES ('2021-07-13 14:06:32.272', 10.2, 219, 0.32);
也可以在自动建表时,只是指定部分TAGS列的取值,未被指定的TAGS列将置为NULL。例如:
INSERT INTO d21001 USING meters (groupId) TAGS (2) VALUES ('2021-07-13 14:06:33.196', 10.15, 217, 0.33);
自动建表语法也支持在一条语句中向多个表插入记录。例如:
INSERT INTO d21001 USING meters TAGS ('California.SanFrancisco', 2) VALUES ('2021-07-13 14:06:34.630', 10.2, 219, 0.32) ('2021-07-13 14:06:35.779', 10.15, 217, 0.33)
d21002 USING meters (groupId) TAGS (2) VALUES ('2021-07-13 14:06:34.255', 10.15, 217, 0.33)
d21003 USING meters (groupId) TAGS (2) (ts, current, phase) VALUES ('2021-07-13 14:06:34.255', 10.27, 0.31);
插入来自文件的数据记录
除了使用VALUES关键字插入一行或多行数据外,也可以把要写入的数据放在CSV文件中(英文逗号分隔、时间戳和字符串类型的值需要用英文单引号括住)供SQL指令读取。其中CSV文件无需表头。例如,如果/tmp/csvfile.csv文件的内容为:
'2021-07-13 14:07:34.630', 10.2, 219, 0.32
'2021-07-13 14:07:35.779', 10.15, 217, 0.33
那么通过如下指令可以把这个文件中的数据写入子表中:
INSERT INTO d1001 FILE '/tmp/csvfile.csv';
插入来自文件的数据记录,并自动建表
INSERT INTO d21001 USING meters TAGS ('California.SanFrancisco', 2) FILE '/tmp/csvfile.csv';
也可以在一条语句中向多个表以自动建表的方式插入记录。例如:
INSERT INTO d21001 USING meters TAGS ('California.SanFrancisco', 2) FILE '/tmp/csvfile_21001.csv'
d21002 USING meters (groupId) TAGS (2) FILE '/tmp/csvfile_21002.csv';
向超级表插入数据并自动创建子表
自动建表, 表名通过tbname列指定
INSERT INTO meters(tbname, location, groupId, ts, current, voltage, phase)
VALUES ('d31001', 'California.SanFrancisco', 2, '2021-07-13 14:06:34.630', 10.2, 219, 0.32)
('d31001', 'California.SanFrancisco', 2, '2021-07-13 14:06:35.779', 10.15, 217, 0.33)
('d31002', NULL, 2, '2021-07-13 14:06:34.255', 10.15, 217, 0.33)
通过CSV文件向超级表插入数据并自动创建子表
根据csv文件内容,为超级表创建子表,并填充相应column与tag
INSERT INTO meters(tbname, location, groupId, ts, current, voltage, phase)
FILE '/tmp/csvfile_21002.csv'