本笔记本将逐步指导您如何使用Tair作为OpenAI嵌入的向量数据库。
本笔记本展示了一个端到端的过程:
- 使用由OpenAI API创建的预计算嵌入。
- 将嵌入存储在Tair的云实例中。
- 使用OpenAI API将原始文本查询转换为嵌入。
- 使用Tair在创建的集合中执行最近邻搜索。
什么是Tair
Tair 是由阿里云开发的云原生内存数据库服务。Tair 兼容开源 Redis,并提供多种数据模型和企业级功能,以支持您的实时在线场景。Tair 还引入了基于新型非易失性内存(NVM)存储介质的持久内存优化实例。这些实例可以降低成本30%,确保数据持久性,并提供几乎与内存数据库相同的性能。Tair 已广泛应用于政务、金融、制造、医疗和泛互联网等领域,以满足其高速查询和计算需求。
Tairvector 是一种内部数据结构,提供高性能的实时向量存储和检索。TairVector 提供了两种索引算法:分层可导航小世界(HNSW)和平面搜索(Flat Search)。此外,TairVector 支持多种距离函数,如欧几里得距离、内积和杰卡德距离。与传统向量检索服务相比,TairVector 具有以下优势:
- 将所有数据存储在内存中,并支持实时索引更新,以减少读写操作的延迟。
- 使用内存中的优化数据结构,以更好地利用存储容量。
- 作为一个开箱即用的数据结构,在简单高效的架构中运行,无需复杂的模块或依赖。
部署选项
- 使用Tair云向量数据库。点击这里快速部署。