Amazon S3 开始在云端提供原生向量支持的对象存储服务
亚马逊在 2025 年 7 月 15 日宣布推出 Amazon S3 Vectors(预览版),这是首个在云端提供原生向量支持的对象存储服务
它专为大规模 AI 向量数据存储与检索设计,相较于传统方式可节省高达 90% 的成本
一、向量支持与核心亮点
- 向量桶(vector buckets):一种新型存储桶类型,配套专用 API,可直接存储和查询向量数据,无需额外基础架构
- 向量索引(vector indexes):每个桶最多支持 10,000 个索引,每个索引可容纳数千万条向量记录;支持在写入时附带元数据(键值对),便于后续过滤与查询
- 自动优化:随着数据变更,S3 Vectors 自动对存储结构进行优化,以持续提升性价比
二、与其他 AWS 服务的深度集成
2.1 Amazon Bedrock / SageMaker Unified Studio
- 可通过 Bedrock 知识库将 S3 Vectors 用作向量存储,实现 Retrieval‑Augmented Generation(RAG)应用
- 在 SageMaker Unified Studio 中也可直接使用这些向量索引,简化构建生成式 AI 应用的流程
2.2 与 OpenSearch 联动
- 支持将近期高频访问的向量导出至 OpenSearch 实现低延迟检索,而长期向量则存于成本更低的 S3 Vectors,实现冷热分层管理
三、使用流程简析
3.1. 创建向量桶(vector bucket)
在 S3 控制台选择 “Vector buckets”→“Create vector bucket”,设置桶名与加密方式(支持 SSE‑S3 或 SSE‑KMS)
3.2. 创建向量索引(vector index)
输入索引名、向量维度,以及距离度量方式(Cosine 或 Euclidean)
3.3. 写入与查询向量
使用 AWS CLI、SDK 或 REST API 写入向量;向量可通过 Bedrock 在 Python 中生成,并由新的 s3vectors
客户端进行存储与检索
3.4. 向 OpenSearch 导出
控制台中支持 “Advanced search export” 功能,可将向量导出至 OpenSearch Serverless 集群中的 KNN 索引
四、适用场景
- 生成式 AI/RAG 系统:支持语义搜索、上下文检索、智能问答等
- 海量多模态数据:如图像、视频、文档、音频等向量嵌入的存储与检索
- 推荐系统、内容分析、文档处理、Agent 记忆等常见 AI 应用
五、上线区域
当前 预览阶段 已在以下区域开放使用:
- 美国东部(弗吉尼亚北部 & 俄亥俄)
- 美国西部(俄勒冈)
- 欧洲(法兰克福)
- 亚太(悉尼)
总结
S3 Vectors 是一项创新性的服务,将传统高成本、自建向量数据库的复杂度转向一站式 SaaS 解决方案,适合构建现代化的生成式 AI 系统。
它集成 S3 的弹性、高可靠与 OpenSearch 的低延迟能力,为向量存储和语义查询提供了高性价比、高扩展性的选择。
https://aws.amazon.com/cn/blogs/aws/introducing-amazon-s3-vectors-first-cloud-storage-with-native-vector-support-at-scale/
标签:infra