MySQL 9.0新特性:向量存储
创作时间:
作者:
@小白创作中心
MySQL 9.0新特性:向量存储
引用
CSDN
1.
https://blog.csdn.net/horses/article/details/140260186
MySQL 9.0 正式版已经发布,其中一个亮点就是向量(VECTOR)数据类型的支持,本文给大家详细介绍一下这个新功能。
向量类型
MySQL 9.0 增加了一个新的向量数据类型:VECTOR。它是一种可以存储 N 个数据项的数据结构(数组),定义方式如下:
VECTOR(N)
其中,每个数据项都是一个 4 字节的单精度浮点数。默认的数据项为 2048 个,最大值为 16383。
向量类型的数据可以使用二进制字符串或者列表分隔的字符串表示,例如:
CREATE TABLE t(id int, rgb vector(3));
INSERT INTO t VALUES (1, to_vector('[255,255,255]'));
INSERT INTO t VALUES (2, to_vector('[128,255,0]'));
INSERT INTO t VALUES (3, to_vector('[0,65,225]'));
向量函数
MySQL 9.0 同时还增加了一些用于操作 VECTOR 数据的向量函数。
首先, STRING_TO_VECTOR 函数用于将字符串形式的向量数据转换为二进制,例如:
SELECT HEX(STRING_TO_VECTOR("[1.05, -17.8, 32]"));
HEX(STRING_TO_VECTOR("[1.05, -17.8, 32]"))|
---+
6666863F66668EC100000042 |
STRING_TO_VECTOR 函数的参数是一个字符串,包含一组由逗号分隔的浮点数,并且使用方括号([])进行引用。
TO_VECTOR 函数是 STRING_TO_VECTOR 函数的同义词。
其次, VECTOR_TO_STRING 函数用于将向量数据转换为字符串,例如:
SELECT VECTOR_TO_STRING(STRING_TO_VECTOR("[1.05, -17.8, 32]"));
VECTOR_TO_STRING(STRING_TO_VECTOR("[1.05, -17.8, 32]"))|
---+
[1.05000e+00,-1.78000e+01,3.20000e+01] |
SELECT VECTOR_TO_STRING(0x00000040000040400000A0400000E040);
VECTOR_TO_STRING(0x00000040000040400000A0400000E040)|
---+
[2.00000e+00,3.00000e+00,5.00000e+00,7.00000e+00] |
输出结果中的浮点数使用科学计数法表示。
FROM_VECTOR 函数是 VECTOR_TO_STRING 函数的同义词。
最后, VECTOR_DIM 函数用于返回向量数据的维度,也就是数据项的个数。例如:
SELECT VECTOR_DIM(rgb) FROM t;
VECTOR_DIM(rgb)|
---+
3|
3|
3|
使用限制
VECTOR 数据类型存在以下限制:
- VECTOR 数据不能和其他类型的数据进行比较,VECTOR 数据只能和其他 VECTOR 数据进行等值比较。
- VECTOR 类型的字段不能作为任何类型的键值,包括主键、外键、唯一键以及分区键。
- VECTOR 类型的字段不能作为直方图的统计源。
- 一些 MySQL 字符串函数可以使用 VECTOR 数据作为参数,包括 BIT_LENGTH()、CHAR_LENGTH()、HEX()、LENGTH() 以及 TO_BASE64()。其他字符串函数不支持 VECTOR 类型的参数。
- VECTOR 数据可以作为以下加密函数的参数:AES_ENCRYPT()、COMPRESS()、MD5()、SHA1()、SHA2()。其他加密函数不支持 VECTOR 类型的参数。
- VECTOR 数据可以作为 CASE 运算符和 COALESCE()、IFNULL()、NULLIF() 以及 IF() 函数的参数。
- VECTOR 数据可以作为 CAST(expression AS BINARY) 的参数,结果返回 VECTOR 数据的二进制字符串。CAST 函数不支持将数据转换为 VECTOR 类型,推荐使用 STRING_TO_VECTOR 函数。
- 除了COUNT 函数之外,VECTOR 数据类型不能作为其他聚合函数或者窗口函数的参数。
- VECTOR 数据不能作为以下函数或运算符的参数:数字函数和运算符、时间函数、全文检索函数、XML 函数、位操作函数以及 JSON 函数。
总结
首先,对于向量数据的支持是一个重大的改进,可以为 MySQL 增加向量存储功能。
不过,目前 MySQL 9.0 只有简单的 VECTOR 数据类型和转换函数,还没有提供向量相似度(余弦相似性、欧氏距离、内积相似性等)检索功能,以及优化查询性能的向量索引,距离一个实用的向量数据库还有一些差距。
热门推荐
元旦打卡三亚南山寺,感受千年文化魅力
海马爸爸育儿法:海洋生态的秘密武器
海马爸爸的育儿经:揭秘雄性怀孕的秘密
雄性海马育儿袋:神奇的海底育儿神器
火影忍者游戏鸣人攻略:实战技巧解析及阵容搭配攻略
五一广场和橘子洲头:长沙地铁沿线必打卡景点
长沙地铁6号线:一条贯穿古今的“时光隧道”
长沙地铁沿线必打卡三大网红景点推荐
冬日浪漫之旅:从橘子洲到岳麓山
海洋中的"全职爸爸":海马育儿袋的奇妙世界
中国科学院权威解读:雄性海马育儿袋的秘密
雄性海马育儿袋:海洋中的"超级奶爸"
中国科学家破解海马育儿袋之谜:从基因到《自然》封面
雄性海马育儿袋进化之谜:科学家新发现揭秘
冬游西北:莫高窟&张掖七彩丹霞,你更爱哪个?
自驾游西北:青海湖夏日绝美打卡点
探秘大西北:雅丹地貌与月牙泉的绝美之旅
素描小白必看!这些工具让你事半功倍
火星时代素描课:从零基础到艺术达人
素描必备:中华牌铅笔使用体验与选购指南
做好车间管理,生产效率提升 !
网纹蟒Thelma的神奇繁殖法:揭秘动物界的单性生殖现象
揭秘犀鸟:从独特繁殖到生态保护的创新之路
中山路美食街荣登全国示范步行街榜单!
直播带货主播走向专业化和职业化,抖音电商一年新增带货达人528万人
王者荣耀法师皮肤的“烂大街”传奇,为何它们依旧深受喜爱?
长沙周末休闲攻略:这些景点无需预约,说走就走!
敦煌莫高窟:西北摄影打卡圣地
青海湖最佳游玩时间揭秘:7-8月最美,但6月或9月更划算!
潮州古城+南澳岛:佛山出发必打卡!