入门指南#
向量搜索新手?#
如果您不熟悉向量搜索的基础知识或向量搜索与向量数据库的区别,那么这份向量搜索指南入门应该能提供一些很好的见解。对于初学者来说,另一个很好的资源是我们的向量数据库与向量搜索指南。正如入门指南中所概述的,向量数据库中使用的向量搜索通常更接近机器学习,而不是传统数据库。这意味着,虽然传统数据库在没有进行任何性能调优的情况下可能会很慢,但它们通常仍然会产生正确的结果。不幸的是,向量搜索索引,像其他机器学习模型一样,如果没有正确调优,可能会产生垃圾结果。
幸运的是,这开启了超参数优化的全新世界,以提升向量搜索的性能和质量。更多信息请参阅我们的索引调优指南。
在比较向量搜索索引的性能时,重要的是要考虑以下三个主要维度:
构建时间
搜索质量
搜索性能
请参阅比较向量搜索索引性能的入门指南,以获取有关方法论的更多信息以及如何在评估过程中进行公平的比较。
支持的索引#
cuVS支持许多标准索引类型,并且列表不断增长,保持与最新技术同步。请参阅我们的向量搜索索引指南,以了解更多关于每种索引类型的信息,了解它们在GPU上的适用场景,以及它们提供的用于权衡性能和质量的可调参数。
cuVS的主要目标是实现速度、规模和灵活性(按此顺序)——其中一个重要的价值主张是通过可扩展的GPU功能增强现有软件部署,以改善痛点,同时不中断当前在CPU上运行良好的系统部分。
使用 cuVS API#
cuVS 是一个核心为 C++ 的库,它通过 C 库进行封装,并通过各种不同的语言进一步暴露。cuVS 目前为 C、C++、Python 和 Rust 提供了 API 和文档,更多语言正在开发中。我们的 API 基础 提供了一些背景和上下文,关于你在使用 cuVS 类型时会遇到的重要范例和词汇类型。
请参考API互操作性指南,了解更多关于cuVS如何与numpy、cupy、tensorflow和pytorch等其他库无缝协作的信息,甚至无需复制设备内存。
接下来去哪里?#
cuVS 是免费且开源的软件,遵循 Apache 2.0 许可证。一旦您熟悉并/或使用过 cuVS,您可以通过 Github 最方便地访问开发者社区。请为任何错误、问题或功能请求在 Github 上提交问题。
博客#
我们经常发布关于支持GPU的向量搜索的博客,这些博客可以深入探讨各种重要主题和突破:
研究#
对于感兴趣的读者,cuVS中的许多加速实现也基于研究论文,这些论文可以提供更多的背景信息。我们也请您在自己的研究中引用相应的算法。
参与进来#
我们始终欢迎新功能和错误修复的补丁。请阅读我们的贡献指南以获取有关向cuVS贡献补丁的更多信息。
社交媒体#
您可以通过Slack、Stack Overflow和X访问RAPIDS社区