Milvus是一个开源的矢量数据库,为人工智能应用和嵌入的相似性搜索提供动力,Milvus使非结构化数据搜索更容易获得,并提供一致的用户体验,无论部署环境如何。
软件特色
全面的相似度指标
Milvus 支持各种常用的相似度计算指标,包括欧氏距离、内积、汉明距离和杰卡德距离等。您可以根据应用需求来选择最有效的向量相似度计算方式。
业界领先的性能
Milvus 基于高度优化的 Approximate Nearest Neighbor Search (ANNS) 索引库构建,包括 faiss、 annoy、和 hnswlib 等。您可以针对不同使用场景选择不同的索引类型。
动态数据管理
您可以随时对数据进行插入、删除、搜索、更新等操作而无需受到静态数据带来的困扰。
近实时搜索
在插入或更新数据之后,您可以几乎立刻对插入或更新过的数据进行搜索。Milvus 负责保证搜索结果的准确率和数据一致性。
高成本效益
Milvus 充分利用现代处理器的并行计算能力,可以在单台通用服务器上完成对十亿级数据的毫秒级搜索。
支持多种数据类型和高级搜索
Milvus 的数据记录中的字段支持多种数据类型。您还可以对一个或多个字段使用高级搜索,例如过滤、排序和聚合。
高扩展性和可靠性
您可以在分布式环境中部署 Milvus。如果要对集群扩容或者增加可靠性,您只需增加节点。
云原生
您可以轻松在公有云、私有云、或混合云上运行 Milvus。
简单易用
Milvus 提供了易用的 Python、Java、Go 和 C++ SDK,另外还提供了 RESTful API。
更新日志
新功能
#1434 Storage:启用s3存储支持(由Unisinsight实现)
#5142支持在GPU内存中保持索引
改进
#5115 CPU搜索上限从16384放松到1M
#5204改进GPU上的试管婴儿查询,当没有实体被删除时
#5544放松index_file_size限制从4GB到128Gb
固定的问题
#4897查询结果包含一些删除的id。
#5164如果在不存在的分区上插入或删除实体,将引发异常。
#5191在持续搜索/插入一段时间后,错误抛出“index out of range”错误
#5398请求执行后随机崩溃
突然断电后加载bloom filter失败
IVF_SQ8和IVF_PQ不能在多个gpu上构建
#5747搜索大nq和topk崩溃milvus
全面的相似度指标
Milvus 支持各种常用的相似度计算指标,包括欧氏距离、内积、汉明距离和杰卡德距离等。您可以根据应用需求来选择最有效的向量相似度计算方式。
业界领先的性能
Milvus 基于高度优化的 Approximate Nearest Neighbor Search (ANNS) 索引库构建,包括 faiss、 annoy、和 hnswlib 等。您可以针对不同使用场景选择不同的索引类型。
动态数据管理
您可以随时对数据进行插入、删除、搜索、更新等操作而无需受到静态数据带来的困扰。
近实时搜索
在插入或更新数据之后,您可以几乎立刻对插入或更新过的数据进行搜索。Milvus 负责保证搜索结果的准确率和数据一致性。
高成本效益
Milvus 充分利用现代处理器的并行计算能力,可以在单台通用服务器上完成对十亿级数据的毫秒级搜索。
支持多种数据类型和高级搜索
Milvus 的数据记录中的字段支持多种数据类型。您还可以对一个或多个字段使用高级搜索,例如过滤、排序和聚合。
高扩展性和可靠性
您可以在分布式环境中部署 Milvus。如果要对集群扩容或者增加可靠性,您只需增加节点。
云原生
您可以轻松在公有云、私有云、或混合云上运行 Milvus。
简单易用
Milvus 提供了易用的 Python、Java、Go 和 C++ SDK,另外还提供了 RESTful API。
新功能
#1434 Storage:启用s3存储支持(由Unisinsight实现)
#5142支持在GPU内存中保持索引
改进
#5115 CPU搜索上限从16384放松到1M
#5204改进GPU上的试管婴儿查询,当没有实体被删除时
#5544放松index_file_size限制从4GB到128Gb
固定的问题
#4897查询结果包含一些删除的id。
#5164如果在不存在的分区上插入或删除实体,将引发异常。
#5191在持续搜索/插入一段时间后,错误抛出“index out of range”错误
#5398请求执行后随机崩溃
突然断电后加载bloom filter失败
IVF_SQ8和IVF_PQ不能在多个gpu上构建
#5747搜索大nq和topk崩溃milvus