MySQL 9.0新特性:向量存储
创作时间:
作者:
@小白创作中心
MySQL 9.0新特性:向量存储
引用
CSDN
1.
https://blog.csdn.net/horses/article/details/140260186
MySQL 9.0 正式版已经发布,其中一个亮点就是向量(VECTOR)数据类型的支持,本文给大家详细介绍一下这个新功能。
向量类型
MySQL 9.0 增加了一个新的向量数据类型:VECTOR。它是一种可以存储 N 个数据项的数据结构(数组),定义方式如下:
VECTOR(N)
其中,每个数据项都是一个 4 字节的单精度浮点数。默认的数据项为 2048 个,最大值为 16383。
向量类型的数据可以使用二进制字符串或者列表分隔的字符串表示,例如:
CREATE TABLE t(id int, rgb vector(3));
INSERT INTO t VALUES (1, to_vector('[255,255,255]'));
INSERT INTO t VALUES (2, to_vector('[128,255,0]'));
INSERT INTO t VALUES (3, to_vector('[0,65,225]'));
向量函数
MySQL 9.0 同时还增加了一些用于操作 VECTOR 数据的向量函数。
首先, STRING_TO_VECTOR 函数用于将字符串形式的向量数据转换为二进制,例如:
SELECT HEX(STRING_TO_VECTOR("[1.05, -17.8, 32]"));
HEX(STRING_TO_VECTOR("[1.05, -17.8, 32]"))|
---+
6666863F66668EC100000042 |
STRING_TO_VECTOR 函数的参数是一个字符串,包含一组由逗号分隔的浮点数,并且使用方括号([])进行引用。
TO_VECTOR 函数是 STRING_TO_VECTOR 函数的同义词。
其次, VECTOR_TO_STRING 函数用于将向量数据转换为字符串,例如:
SELECT VECTOR_TO_STRING(STRING_TO_VECTOR("[1.05, -17.8, 32]"));
VECTOR_TO_STRING(STRING_TO_VECTOR("[1.05, -17.8, 32]"))|
---+
[1.05000e+00,-1.78000e+01,3.20000e+01] |
SELECT VECTOR_TO_STRING(0x00000040000040400000A0400000E040);
VECTOR_TO_STRING(0x00000040000040400000A0400000E040)|
---+
[2.00000e+00,3.00000e+00,5.00000e+00,7.00000e+00] |
输出结果中的浮点数使用科学计数法表示。
FROM_VECTOR 函数是 VECTOR_TO_STRING 函数的同义词。
最后, VECTOR_DIM 函数用于返回向量数据的维度,也就是数据项的个数。例如:
SELECT VECTOR_DIM(rgb) FROM t;
VECTOR_DIM(rgb)|
---+
3|
3|
3|
使用限制
VECTOR 数据类型存在以下限制:
- VECTOR 数据不能和其他类型的数据进行比较,VECTOR 数据只能和其他 VECTOR 数据进行等值比较。
- VECTOR 类型的字段不能作为任何类型的键值,包括主键、外键、唯一键以及分区键。
- VECTOR 类型的字段不能作为直方图的统计源。
- 一些 MySQL 字符串函数可以使用 VECTOR 数据作为参数,包括 BIT_LENGTH()、CHAR_LENGTH()、HEX()、LENGTH() 以及 TO_BASE64()。其他字符串函数不支持 VECTOR 类型的参数。
- VECTOR 数据可以作为以下加密函数的参数:AES_ENCRYPT()、COMPRESS()、MD5()、SHA1()、SHA2()。其他加密函数不支持 VECTOR 类型的参数。
- VECTOR 数据可以作为 CASE 运算符和 COALESCE()、IFNULL()、NULLIF() 以及 IF() 函数的参数。
- VECTOR 数据可以作为 CAST(expression AS BINARY) 的参数,结果返回 VECTOR 数据的二进制字符串。CAST 函数不支持将数据转换为 VECTOR 类型,推荐使用 STRING_TO_VECTOR 函数。
- 除了COUNT 函数之外,VECTOR 数据类型不能作为其他聚合函数或者窗口函数的参数。
- VECTOR 数据不能作为以下函数或运算符的参数:数字函数和运算符、时间函数、全文检索函数、XML 函数、位操作函数以及 JSON 函数。
总结
首先,对于向量数据的支持是一个重大的改进,可以为 MySQL 增加向量存储功能。
不过,目前 MySQL 9.0 只有简单的 VECTOR 数据类型和转换函数,还没有提供向量相似度(余弦相似性、欧氏距离、内积相似性等)检索功能,以及优化查询性能的向量索引,距离一个实用的向量数据库还有一些差距。
热门推荐
“产业园区”变身“文化园区” 杭州老旧厂房改造让工业遗产“活”起来
终结的炽天使OVA全解析:重返天使与人类的对立
立春养生正当时,您支招健康过春
虎狮豹:谁才是真正的生态守护神?
秋冬痰多?中医教你几招轻松化痰!
离婚后如何快速自我疗愈?这份心理重建指南请收好
玉石豹子:古文化中的力量与智慧
Science最新研究:美洲豹与豹子的进化之谜
离婚期间如何管理你的家庭资产?
离婚程序大揭秘:法律条文+实际案例
清明时节话祭祖:传统与现代的交融
佛教丧礼:如何为亲人祈福超度?
寒衣节:一袭寒衣寄哀思
中国传统拜祭礼仪:千年文化的传承与创新
甲型H1N1来袭!现在打疫苗还来得及吗?
小学生甲流防控小妙招
世上到底有没有因果报应?
北京世纪坛医院专家推荐:秋冬去痰食谱
电影《无名》剧情深度解析探讨
周公解梦:古人的梦境密码
量化金融在投资决策中的作用是什么?这种分析方法的优势和局限性是什么?
李道宗,李世民堂兄弟,一个被低估的唐初名将
《量子破碎》:时空穿梭者的开挂体验
《梦幻西游》时空穿梭攻略:助你成为游戏高手!
《王牌竞速》新技能攻略:如何玩转时空穿梭?
《星际穿越》:时空穿梭的科幻魅力
“未来之旅”带你穿越时空:VR实景展厅的创新体验
迪拜Al Ghubaibah站最新交通指南
掌握食品安全营养小常识,守护健康好身体
基督教也不吃猪肉?背后的原因,一看就明白了