问小白 wenxiaobai

资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

一文讲透什么是向量数据库？

创作时间:

作者:

@小白创作中心

一文讲透什么是向量数据库？

引用

CSDN

1.

https://blog.csdn.net/weixin_53880910/article/details/141246491

向量数据库是AI时代的重要基础设施之一，它通过将数据转换为向量嵌入，实现了更精准的语义搜索和数据检索。本文将为您详细解析向量数据库的核心概念、工作原理及其在AI应用中的重要作用。

向量数据库是一种组织有序的向量嵌入集合，整合了可以随时创建、读取、更新和删除的向量嵌入。向量嵌入将数据块（例如文本或图像）表示为数值。

什么是嵌入模型？

嵌入模型会将各种数据（例如文本、图像、图表和视频）转换为数值向量，以便捕捉其在多维向量空间中的含义和细微差别。嵌入技术的选择取决于应用需求，同时要兼顾语义深度、计算效率、要编码的数据的类型、维度等因素。

man、king、woman 和 queen 这几个词映射到的向量空间（来源：baeldung）

通过将向量映射到多维空间，可以对向量的语义相似性进行细致的分析，从而显著提高搜索和数据分类的准确性。在使用 AI 聊天机器人、大语言模型（LLM）、检索增强生成（RAG）和向量数据库的 AI 应用中以及在搜索引擎和许多其他用例中，嵌入模型发挥着至关重要的作用。

嵌入模型如何与向量数据库搭配使用？

提取私有企业数据后，系统会将这些数据分块，创建一个向量来表示它们，并将数据块及其对应的向量同可选的元数据一起存储在向量数据库中，以供日后检索。

嵌入模型用于提取数据及理解用户提示
在收到用户、聊天机器人或 AI 应用发来的查询后，系统会对其进行解析，并使用嵌入模型来获取代表提示的各个部分的向量嵌入。然后，使用提示的向量在向量数据库中执行语义搜索，以找到确切匹配或相似度排名前 K 位的向量及其相应的数据块，这些数据块会被放入到提示的上下文中，然后被发送给 LLM。

LangChain 和 LlamaIndex 都是热门的开源框架，支持创建 AI 聊天机器人和 LLM 解决方案。热门的 LLM 包括 OpenAI GPT 和 Meta LlaMA。热门的向量数据库包括 Pinecone 和 Milvus 等。两大热门编程语言是 Python 和 TypeScript。

向量数据库中的相似性搜索是什么？

相似性搜索（也称为向量搜索、向量相似性搜索或语义搜索）是指人工智能应用程序根据指定的相似性度量标准，从数据库中高效地检索与给定查询的向量嵌入在语义上相似的向量的过程：

欧几里得距离：测量各点之间的直接距离。这对于总体差异至关重要的密集特征集的聚类或分类非常有用。
余弦相似度：关注向量之间的角度。非常适合文本处理和信息检索，根据方向（而非传统的距离）捕获语义相似性。

热门推荐

<大明宫词>里的唐代服饰：从初唐含蓄到盛唐开放

<大明宫词>里的唐代服饰：从初唐含蓄到盛唐开放

<大明宫词>：用优美台词重现大唐风华

<大明宫词>：用优美台词重现大唐风华

新手爸妈必读：抚触按摩让宝宝睡得香、吃得香

新手爸妈必读：抚触按摩让宝宝睡得香、吃得香

远离热源稳电压，这样保养电视能用10年

远离热源稳电压，这样保养电视能用10年

调低亮度、定期清洁：让液晶电视更省电更耐用

调低亮度、定期清洁：让液晶电视更省电更耐用

茶话会必备：6个趣味游戏让聚会氛围更融洽

茶话会必备：6个趣味游戏让聚会氛围更融洽

茶话会必备礼仪：泡茶、倒茶、分茶、奉茶全解析

茶话会必备礼仪：泡茶、倒茶、分茶、奉茶全解析

从背篓接球到疯狂猜词：茶话会团队游戏全攻略

从背篓接球到疯狂猜词：茶话会团队游戏全攻略

30平米一居室装修案例：开放式布局与多功能设计让空间利用率最大化

30平米一居室装修案例：开放式布局与多功能设计让空间利用率最大化

网约车司机撞上保时捷成被告，揭开“车辆安全统筹”风险隐患

网约车司机撞上保时捷成被告，揭开“车辆安全统筹”风险隐患

网约车叫来出租车出事故，保险公司免责条款被判无效

网约车叫来出租车出事故，保险公司免责条款被判无效

抗流感病毒药物如何选？最佳用药时机别错过！

抗流感病毒药物如何选？最佳用药时机别错过！

周鸿祎雷军营销对比：一个单打独斗，一个团队作战

周鸿祎雷军营销对比：一个单打独斗，一个团队作战

农安法院温情调解，保障探望权

农安法院温情调解，保障探望权

牙髓治疗：让你告别蛀牙痛的科学方法

牙髓治疗：让你告别蛀牙痛的科学方法

牛奶：护牙神器，防蛀牙首选

牛奶：护牙神器，防蛀牙首选

牙医教你科学护牙，远离蛀牙困扰

牙医教你科学护牙，远离蛀牙困扰

小说创作十步走：从灵感到完稿的完整指南

小说创作十步走：从灵感到完稿的完整指南

中国古典哲学在小说创作中的应用与创新

中国古典哲学在小说创作中的应用与创新

瑞舒伐他汀/依折麦布复方制剂上市，带来血脂管理新希望

瑞舒伐他汀/依折麦布复方制剂上市，带来血脂管理新希望

豪门媳妇胡静的时间管理术：如何兼顾事业与育儿

豪门媳妇胡静的时间管理术：如何兼顾事业与育儿

“虎妈”胡静：戏里严苛戏外宽松，谈教育之道

“虎妈”胡静：戏里严苛戏外宽松，谈教育之道

李理谦教你墙面装饰的风水秘诀

李理谦教你墙面装饰的风水秘诀

经典壁画引领墙面装饰新潮流

经典壁画引领墙面装饰新潮流

Noromega教你正确吃海豹油

Noromega教你正确吃海豹油

Noromega海豹油：心血管健康的明智之选

Noromega海豹油：心血管健康的明智之选

活特康海豹油：降血脂效果如何？科学解读与用户反馈

活特康海豹油：降血脂效果如何？科学解读与用户反馈

移动支付时代游戏代充的安全性与注意事项

移动支付时代游戏代充的安全性与注意事项

从感知到社交：音乐教育如何促进幼儿成长

从感知到社交：音乐教育如何促进幼儿成长

南开中学与大学城三中：一场持续深化的文化交流盛宴

南开中学与大学城三中：一场持续深化的文化交流盛宴

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号