本笔记本适用于以下场景:
- 您的数据未进行向量化处理
- 您希望对您的数据运行向量搜索
- 您希望将Weaviate与OpenAI模块(text2vec-openai)结合使用,为您生成向量嵌入。
本笔记本将引导您完成一个简单流程:设置Weaviate实例、连接该实例(使用OpenAI API密钥)、配置数据模式、导入数据(系统会自动为您的数据生成向量嵌入)以及运行语义搜索。
对于希望在安全环境中存储和搜索我们的嵌入向量以支持生产用例(如聊天机器人、主题建模等)的客户来说,这是一个常见需求。
什么是Weaviate
Weaviate 是一个开源的向量搜索引擎,能够将数据对象与其向量一起存储。这使得向量搜索可以与结构化过滤相结合。
Weaviate 采用 KNN 算法创建向量优化索引,使您的查询能够极速运行。了解更多 here。
Weaviate让您能够使用最喜爱的机器学习模型,并轻松扩展至数十亿数据对象。
部署选项
无论您的应用场景或生产环境如何,Weaviate都能为您提供合适的解决方案。您可以通过以下方式部署Weaviate:
- 自托管 - 您可以在本地通过docker部署Weaviate,或部署到任意服务器。
- SaaS – 你可以使用Weaviate云服务(WCS)来托管你的Weaviate实例。
- 混合SaaS - 您可以在自己的私有云服务中部署Weaviate。
编程语言
Weaviate提供四种客户端库,可让您从应用程序中进行通信:
此外,Weaviate还提供REST层接口。基本上,您可以使用任何支持REST请求的语言来调用Weaviate。