亚马逊在 2025 年 7 月 15 日宣布推出 Amazon S3 Vectors(预览版),这是首个在云端提供原生向量支持的对象存储服务

它专为大规模 AI 向量数据存储与检索设计,相较于传统方式可节省高达 90% 的成本


一、向量支持与核心亮点

  • 向量桶(vector buckets):一种新型存储桶类型,配套专用 API,可直接存储和查询向量数据,无需额外基础架构
  • 向量索引(vector indexes):每个桶最多支持 10,000 个索引,每个索引可容纳数千万条向量记录;支持在写入时附带元数据(键值对),便于后续过滤与查询
  • 自动优化:随着数据变更,S3 Vectors 自动对存储结构进行优化,以持续提升性价比

二、与其他 AWS 服务的深度集成

2.1 Amazon Bedrock / SageMaker Unified Studio

  • 可通过 Bedrock 知识库将 S3 Vectors 用作向量存储,实现 Retrieval‑Augmented Generation(RAG)应用
  • 在 SageMaker Unified Studio 中也可直接使用这些向量索引,简化构建生成式 AI 应用的流程

2.2 与 OpenSearch 联动

  • 支持将近期高频访问的向量导出至 OpenSearch 实现低延迟检索,而长期向量则存于成本更低的 S3 Vectors,实现冷热分层管理

三、使用流程简析

3.1. 创建向量桶(vector bucket)
在 S3 控制台选择 “Vector buckets”→“Create vector bucket”,设置桶名与加密方式(支持 SSE‑S3 或 SSE‑KMS)

3.2. 创建向量索引(vector index)
输入索引名、向量维度,以及距离度量方式(Cosine 或 Euclidean)

3.3. 写入与查询向量
使用 AWS CLI、SDK 或 REST API 写入向量;向量可通过 Bedrock 在 Python 中生成,并由新的 s3vectors 客户端进行存储与检索

3.4. 向 OpenSearch 导出
控制台中支持 “Advanced search export” 功能,可将向量导出至 OpenSearch Serverless 集群中的 KNN 索引


四、适用场景

  • 生成式 AI/RAG 系统:支持语义搜索、上下文检索、智能问答等
  • 海量多模态数据:如图像、视频、文档、音频等向量嵌入的存储与检索
  • 推荐系统、内容分析、文档处理、Agent 记忆等常见 AI 应用

五、上线区域

当前 预览阶段 已在以下区域开放使用:

  • 美国东部(弗吉尼亚北部 & 俄亥俄)
  • 美国西部(俄勒冈)
  • 欧洲(法兰克福)
  • 亚太(悉尼)

总结

S3 Vectors 是一项创新性的服务,将传统高成本、自建向量数据库的复杂度转向一站式 SaaS 解决方案,适合构建现代化的生成式 AI 系统。

它集成 S3 的弹性、高可靠与 OpenSearch 的低延迟能力,为向量存储和语义查询提供了高性价比、高扩展性的选择。

https://aws.amazon.com/cn/blogs/aws/introducing-amazon-s3-vectors-first-cloud-storage-with-native-vector-support-at-scale/

标签:infra

你的评论