本笔记本将逐步指导您如何使用Tair作为OpenAI嵌入向量的向量数据库。
本笔记本展示了一个端到端流程,包括:
- 使用由OpenAI API生成的预计算嵌入。
- 将嵌入向量存储在Tair的云实例中。
- 使用OpenAI API将原始文本查询转换为嵌入向量。
- 使用Tair在创建的集合中执行最近邻搜索。
什么是Tair
Tair 是由阿里云开发的云原生内存数据库服务。Tair 兼容开源 Redis,提供多种数据模型和企业级功能,以支持您的实时在线场景。Tair 还推出了基于新型非易失性内存(NVM)存储介质的持久内存优化实例,这些实例可降低成本达30%,确保数据持久性,并提供与内存数据库几乎相同的性能。Tair 已广泛应用于政务、金融、制造、医疗和泛互联网等领域,满足其高速查询和计算需求。
Tairvector 是一个内部数据结构,提供高性能的实时向量存储和检索功能。TairVector 提供两种索引算法:分层可导航小世界(HNSW)和平坦搜索。此外,TairVector 支持多种距离函数,例如欧几里得距离、内积和杰卡德距离。与传统向量检索服务相比,TairVector 具有以下优势:
- 将所有数据存储在内存中,并支持实时索引更新,以降低读写操作的延迟。
- 在内存中使用优化的数据结构,以更好地利用存储容量。
- 作为一种开箱即用的数据结构,采用简单高效的架构,无需复杂的模块或依赖项。
部署选项
- 使用 Tair Cloud Vector Database。点击此处快速部署。