MySQL 9.0新特性:向量存储
创作时间:
作者:
@小白创作中心
MySQL 9.0新特性:向量存储
引用
CSDN
1.
https://blog.csdn.net/horses/article/details/140260186
MySQL 9.0 正式版已经发布,其中一个亮点就是向量(VECTOR)数据类型的支持,本文给大家详细介绍一下这个新功能。
向量类型
MySQL 9.0 增加了一个新的向量数据类型:VECTOR。它是一种可以存储 N 个数据项的数据结构(数组),定义方式如下:
VECTOR(N)
其中,每个数据项都是一个 4 字节的单精度浮点数。默认的数据项为 2048 个,最大值为 16383。
向量类型的数据可以使用二进制字符串或者列表分隔的字符串表示,例如:
CREATE TABLE t(id int, rgb vector(3));
INSERT INTO t VALUES (1, to_vector('[255,255,255]'));
INSERT INTO t VALUES (2, to_vector('[128,255,0]'));
INSERT INTO t VALUES (3, to_vector('[0,65,225]'));
向量函数
MySQL 9.0 同时还增加了一些用于操作 VECTOR 数据的向量函数。
首先, STRING_TO_VECTOR 函数用于将字符串形式的向量数据转换为二进制,例如:
SELECT HEX(STRING_TO_VECTOR("[1.05, -17.8, 32]"));
HEX(STRING_TO_VECTOR("[1.05, -17.8, 32]"))|
---+
6666863F66668EC100000042 |
STRING_TO_VECTOR 函数的参数是一个字符串,包含一组由逗号分隔的浮点数,并且使用方括号([])进行引用。
TO_VECTOR 函数是 STRING_TO_VECTOR 函数的同义词。
其次, VECTOR_TO_STRING 函数用于将向量数据转换为字符串,例如:
SELECT VECTOR_TO_STRING(STRING_TO_VECTOR("[1.05, -17.8, 32]"));
VECTOR_TO_STRING(STRING_TO_VECTOR("[1.05, -17.8, 32]"))|
---+
[1.05000e+00,-1.78000e+01,3.20000e+01] |
SELECT VECTOR_TO_STRING(0x00000040000040400000A0400000E040);
VECTOR_TO_STRING(0x00000040000040400000A0400000E040)|
---+
[2.00000e+00,3.00000e+00,5.00000e+00,7.00000e+00] |
输出结果中的浮点数使用科学计数法表示。
FROM_VECTOR 函数是 VECTOR_TO_STRING 函数的同义词。
最后, VECTOR_DIM 函数用于返回向量数据的维度,也就是数据项的个数。例如:
SELECT VECTOR_DIM(rgb) FROM t;
VECTOR_DIM(rgb)|
---+
3|
3|
3|
使用限制
VECTOR 数据类型存在以下限制:
- VECTOR 数据不能和其他类型的数据进行比较,VECTOR 数据只能和其他 VECTOR 数据进行等值比较。
- VECTOR 类型的字段不能作为任何类型的键值,包括主键、外键、唯一键以及分区键。
- VECTOR 类型的字段不能作为直方图的统计源。
- 一些 MySQL 字符串函数可以使用 VECTOR 数据作为参数,包括 BIT_LENGTH()、CHAR_LENGTH()、HEX()、LENGTH() 以及 TO_BASE64()。其他字符串函数不支持 VECTOR 类型的参数。
- VECTOR 数据可以作为以下加密函数的参数:AES_ENCRYPT()、COMPRESS()、MD5()、SHA1()、SHA2()。其他加密函数不支持 VECTOR 类型的参数。
- VECTOR 数据可以作为 CASE 运算符和 COALESCE()、IFNULL()、NULLIF() 以及 IF() 函数的参数。
- VECTOR 数据可以作为 CAST(expression AS BINARY) 的参数,结果返回 VECTOR 数据的二进制字符串。CAST 函数不支持将数据转换为 VECTOR 类型,推荐使用 STRING_TO_VECTOR 函数。
- 除了COUNT 函数之外,VECTOR 数据类型不能作为其他聚合函数或者窗口函数的参数。
- VECTOR 数据不能作为以下函数或运算符的参数:数字函数和运算符、时间函数、全文检索函数、XML 函数、位操作函数以及 JSON 函数。
总结
首先,对于向量数据的支持是一个重大的改进,可以为 MySQL 增加向量存储功能。
不过,目前 MySQL 9.0 只有简单的 VECTOR 数据类型和转换函数,还没有提供向量相似度(余弦相似性、欧氏距离、内积相似性等)检索功能,以及优化查询性能的向量索引,距离一个实用的向量数据库还有一些差距。
热门推荐
一文掌握剪映:基础功能到节日祝福视频制作实战
张明医生教你高效燃脂,告别减肥瓶颈期
法院判决:二胎家庭抚养权归属应以子女利益最大化为准
冬季餐桌必备:如何挑选新鲜比目鱼
【原】茼蒿的最佳吃法?传统与创新吃法大比拼,你更爱哪一款?
户外运动助力心理健康,科学证实可有效缓解焦虑
信息技术助力安全生产标准化评估
艾灸治疗脑卒中痉挛性偏瘫,临床研究证实有效
当归食疗全攻略:五款经典食谱与食用禁忌
研究证实:八段锦可有效促进心脏支架术后康复
从农田到餐桌 河南筑牢食品安全防线
重庆西站周边游:古镇文化、动物萌宠、夜景打卡一文搞定
用电饭锅轻松做煲仔饭,7步打造地道广式美味
一文掌握营养成分表计算:蛋白质、脂肪等核心指标详解
阿基米德原理与浮力公式:从船只航行到气象观测的应用
跨国婚姻的浪漫与现实:从马雅舒13年婚姻看文化融合
六成大学生感孤独,专家建议构建校园心理健康支持体系
孤独并不可怕:如何面对孤独并实现自我成长
中国古代邮政制度的演变:从战国驿站到唐朝邮传舍人
颈椎病引发后背疼痛怎么办?6大措施助你预防和缓解
李白、王羲之、苏轼的那些趣事
从学生到老师:8部必看的教育电影改变你的人生观
加盐让鸡蛋浮起来,揭秘水中沉浮的科学原理
松哥打虎转行卖酒,打假变带货?
探秘邯郸:十处自然风光的绝美画卷
日本治疗肺结节医院全攻略:4家权威医院推荐
冬季洗牙攻略:如何省下一杯奶茶钱?
香酥带鱼:教你在家做出外酥里嫩的美味佳肴!
数字课程、健身活动、文化体验:12种方式助力老人社交
长期低温储存试验:低温试验箱评估材料耐久性