Kusto 作为向量数据库

May 10, 2023
Open in Github

Azure Data Explorer 又名 Kusto 是一种基于云的数据分析服务,使用户能够对大型数据集进行实时高级分析。它特别适合处理大量数据,是存储和搜索向量的绝佳选择。

Kusto 支持一种称为 dynamic 的特殊数据类型,它可以存储非结构化数据,如数组和属性包。Dynamic 数据类型非常适合存储向量值。您可以通过将与原始对象相关的元数据作为表中的单独列来进一步增强向量值。
Kusto 还支持内置函数 series_cosine_similarity_fl 来执行向量相似性搜索。

Get started 免费开始使用Kusto。

Kusto_Vector

Kusto 和 Open AI 嵌入入门

演示场景

Wiki_embeddings

语义搜索流程

如果你想尝试这个演示,请按照Notebook中的说明操作。

它将允许你 -

  1. 使用由OpenAI API创建的预计算嵌入。

  2. 将嵌入存储在Kusto中。

  3. 将原始文本查询转换为嵌入使用OpenAI API。

  4. 使用Kusto在存储的嵌入中执行余弦相似性搜索。