本文主要介绍向量检索服务的基本概念、产品优势。
**前置概念**
-------------------------
阅读本文前,您可能需要了解如下概念:
* 什么是GPU?https://www.aliyun.com/getting-started/what-is/what-is-gpu?spm=a2c4g.2510225.0.0.1dd977ceLB90dS
* 什么是云原生?https://www.aliyun.com/getting-started/what-is/what-is-cloud-native?spm=a2c4g.2510225.0.0.1dd977ceLB90dS
什么是向量检索服务
--------------------------
向量检索服务DashVector基于通义实验室自研的高效向量引擎Proxima内核,提供具备水平拓展能力的云原生、全托管的向量检索服务。DashVector将其强大的向量管理、向量查询等多样化能力,通过简洁易用的SDK/AP接口透出,方便被上层AI应用迅速集成,从而为包括大模型生态、多模态AI搜索、分子结构分析在内的多种应用场景,提供所需的高效向量检索能力。
**产品地址**
-----------------
产品首页:https://www.alibabacloud.com/product/dashvector
控制台首页:https://dashvector.console.aliyun.com
**产品优势**
-------------------------
* **多维度高精度:** 依据不同数据维度和分布选择不同算法或算法组合,根据具体场景需求实现精度和性能之间的平衡。
* **实时在线更新:** 采用扁平化的索引结构,支持在线大规模向量索引的从0到1的流式构建,实现了索引即增即查、即时落盘,以及实时动态更新。
* **高性能低成本:** 有限成本下实现最大化性能并满足业务的需求。
* **多场景适配:** 结合超参调优和复合索引等方法,提高系统的自动化能力,以及增强用户的易用性。
* **超大规模索引构建和检索:** 引入复合性检索算法,精于工程实现和算法底层优化,低成本实现高效率的检索方法,单片索引可达几十亿的规模。
* **标签+向量检索:** 在索引算法层实现了"带条件的向量检索",解决了传统多路归并召回结果不理想的情况,满足组合检索的要求。
* **索引水平扩展:** 采用非对等分片方法实现分布式检索,支持有限精度下索引的快速合并,与Map-Reduce计算模型可有效结合。
* **异构计算:** 支持大批量高吞吐的离线检索加速,支持GPU构建邻居图索引,成功实现小批量+低延时+高吞吐的资源利用。
* **Serverless** :支持Serverless能力,为用户提供按需使用、弹性扩缩和免运维的使用体验。
有疑问加站长微信联系(非本文作者))