MySQL 9.0新特性:向量存储
创作时间:
作者:
@小白创作中心
MySQL 9.0新特性:向量存储
引用
CSDN
1.
https://blog.csdn.net/horses/article/details/140260186
MySQL 9.0 正式版已经发布,其中一个亮点就是向量(VECTOR)数据类型的支持,本文给大家详细介绍一下这个新功能。
向量类型
MySQL 9.0 增加了一个新的向量数据类型:VECTOR。它是一种可以存储 N 个数据项的数据结构(数组),定义方式如下:
VECTOR(N)
其中,每个数据项都是一个 4 字节的单精度浮点数。默认的数据项为 2048 个,最大值为 16383。
向量类型的数据可以使用二进制字符串或者列表分隔的字符串表示,例如:
CREATE TABLE t(id int, rgb vector(3));
INSERT INTO t VALUES (1, to_vector('[255,255,255]'));
INSERT INTO t VALUES (2, to_vector('[128,255,0]'));
INSERT INTO t VALUES (3, to_vector('[0,65,225]'));
向量函数
MySQL 9.0 同时还增加了一些用于操作 VECTOR 数据的向量函数。
首先, STRING_TO_VECTOR 函数用于将字符串形式的向量数据转换为二进制,例如:
SELECT HEX(STRING_TO_VECTOR("[1.05, -17.8, 32]"));
HEX(STRING_TO_VECTOR("[1.05, -17.8, 32]"))|
---+
6666863F66668EC100000042 |
STRING_TO_VECTOR 函数的参数是一个字符串,包含一组由逗号分隔的浮点数,并且使用方括号([])进行引用。
TO_VECTOR 函数是 STRING_TO_VECTOR 函数的同义词。
其次, VECTOR_TO_STRING 函数用于将向量数据转换为字符串,例如:
SELECT VECTOR_TO_STRING(STRING_TO_VECTOR("[1.05, -17.8, 32]"));
VECTOR_TO_STRING(STRING_TO_VECTOR("[1.05, -17.8, 32]"))|
---+
[1.05000e+00,-1.78000e+01,3.20000e+01] |
SELECT VECTOR_TO_STRING(0x00000040000040400000A0400000E040);
VECTOR_TO_STRING(0x00000040000040400000A0400000E040)|
---+
[2.00000e+00,3.00000e+00,5.00000e+00,7.00000e+00] |
输出结果中的浮点数使用科学计数法表示。
FROM_VECTOR 函数是 VECTOR_TO_STRING 函数的同义词。
最后, VECTOR_DIM 函数用于返回向量数据的维度,也就是数据项的个数。例如:
SELECT VECTOR_DIM(rgb) FROM t;
VECTOR_DIM(rgb)|
---+
3|
3|
3|
使用限制
VECTOR 数据类型存在以下限制:
- VECTOR 数据不能和其他类型的数据进行比较,VECTOR 数据只能和其他 VECTOR 数据进行等值比较。
- VECTOR 类型的字段不能作为任何类型的键值,包括主键、外键、唯一键以及分区键。
- VECTOR 类型的字段不能作为直方图的统计源。
- 一些 MySQL 字符串函数可以使用 VECTOR 数据作为参数,包括 BIT_LENGTH()、CHAR_LENGTH()、HEX()、LENGTH() 以及 TO_BASE64()。其他字符串函数不支持 VECTOR 类型的参数。
- VECTOR 数据可以作为以下加密函数的参数:AES_ENCRYPT()、COMPRESS()、MD5()、SHA1()、SHA2()。其他加密函数不支持 VECTOR 类型的参数。
- VECTOR 数据可以作为 CASE 运算符和 COALESCE()、IFNULL()、NULLIF() 以及 IF() 函数的参数。
- VECTOR 数据可以作为 CAST(expression AS BINARY) 的参数,结果返回 VECTOR 数据的二进制字符串。CAST 函数不支持将数据转换为 VECTOR 类型,推荐使用 STRING_TO_VECTOR 函数。
- 除了COUNT 函数之外,VECTOR 数据类型不能作为其他聚合函数或者窗口函数的参数。
- VECTOR 数据不能作为以下函数或运算符的参数:数字函数和运算符、时间函数、全文检索函数、XML 函数、位操作函数以及 JSON 函数。
总结
首先,对于向量数据的支持是一个重大的改进,可以为 MySQL 增加向量存储功能。
不过,目前 MySQL 9.0 只有简单的 VECTOR 数据类型和转换函数,还没有提供向量相似度(余弦相似性、欧氏距离、内积相似性等)检索功能,以及优化查询性能的向量索引,距离一个实用的向量数据库还有一些差距。
热门推荐
明德学堂与湖南辛亥革命
樟脑丸怎么用?使用注意事项全解析
查体发现肺结节不要慌!专家教你如何应对……
南昌公务员工资多少
个人简历的培训经历怎么写
云南最好吃的菌子前5名,见手青未上榜,第一名是它,你吃过哪个
总要来云南吃一碗过桥米线吧!
档案管理员的日常工作流程是怎样的?
红薯和豆浆可以一起吃吗
万年青生长养护秘籍:绝密技巧让你的绿植繁茂如林!
为学龄期儿童听力健康保驾护航——听力筛查与校园听力保健
尿量正常值范围
干煸鸭:的详细做法
史上最全手机发展史,还记得那些年我们用过的手机吗?
20式枪族在枪管寿命方面采用的3项技术途径
农村拆迁中独生子女家庭能享受哪些优惠政策?
啤酒世界的奥秘:揭秘各种啤酒类型的独特魅力
系统功能性能优化:从问题定位到解决方案的系统性分析
退休教师自制阳台核电池供电?揭秘民用核电池的幻象与现实
PPT如何做出视频的效果
是药三分毒?药师教你学会如何避免和应对西药副作用
9款止咳汤水食疗:针对不同咳嗽症状的中医方案
供应链中断风险增加,企业该如何应对挑战?
清朝巡抚相当于现在的什么官
清朝总督、巡抚,加衔都御史、尚书、侍郎,里面门道,带您看看
植发技术大揭秘:从FUT到3D植发,5种主流技术详解及费用参考
脚总是冰凉怎么办?医生给出专业解答
带你识别刺五加
拉肚子怎么办,快速止泻小妙招
人民日报点赞河钢:钢铁业深度调整显韧性