Amazon S3 开始在云端提供原生向量支持的对象存储服务

亚马逊在 2025 年 7 月 15 日宣布推出 Amazon S3 Vectors（预览版），这是首个在云端提供原生向量支持的对象存储服务

它专为大规模 AI 向量数据存储与检索设计，相较于传统方式可节省高达 90% 的成本

一、向量支持与核心亮点

向量桶（vector buckets）：一种新型存储桶类型，配套专用 API，可直接存储和查询向量数据，无需额外基础架构
向量索引（vector indexes）：每个桶最多支持 10,000 个索引，每个索引可容纳数千万条向量记录；支持在写入时附带元数据（键值对），便于后续过滤与查询
自动优化：随着数据变更，S3 Vectors 自动对存储结构进行优化，以持续提升性价比

3.1. 创建向量桶（vector bucket）
在 S3 控制台选择 “Vector buckets”→“Create vector bucket”，设置桶名与加密方式（支持 SSE‑S3 或 SSE‑KMS）

3.2. 创建向量索引（vector index）
输入索引名、向量维度，以及距离度量方式（Cosine 或 Euclidean）

3.3. 写入与查询向量
使用 AWS CLI、SDK 或 REST API 写入向量；向量可通过 Bedrock 在 Python 中生成，并由新的 s3vectors 客户端进行存储与检索

3.4. 向 OpenSearch 导出
控制台中支持 “Advanced search export” 功能，可将向量导出至 OpenSearch Serverless 集群中的 KNN 索引

当前 预览阶段 已在以下区域开放使用：

S3 Vectors 是一项创新性的服务，将传统高成本、自建向量数据库的复杂度转向一站式 SaaS 解决方案，适合构建现代化的生成式 AI 系统。

它集成 S3 的弹性、高可靠与 OpenSearch 的低延迟能力，为向量存储和语义查询提供了高性价比、高扩展性的选择。

标签：infra