https://github.com/WyseOS/wyse-browser 1. 产品定位 Wyse Browser 是一个 专为 AI Agents、自动化系统和可编排任务(flows)打造的浏览器执行层(Browser Runtime Layer) 。 通过多进程沙箱浏览器、REST API、可复用 Worklets,以及可横向扩展的执行架构,使 LLM / Agent 能够稳定、可控、可观测地操作真实网页。
“让任何 LLM 在真实互联网环境中可控地执行操作。”
2. 目标用户 核心用户 AI Agent 平台(自研 或 SaaS) AI 原生产品团队:需要让 LLM 执行真实网页任务 自动化工程 / RPA 团队 数据抓取 / 爬虫 / 增量监控系统 QA / 自动化测试团队(多会话并发测试) 扩展用户 内部工具团队:运营、风控、营销等需要自动化网页流程 3. 核心价值 用户痛点 Wyse 的解决方式 AI 输出难稳定落地为真实网页操作 Worklets + Flows 将自然语言指令结构化为可重复执行的步骤 多浏览器实例难管理(资源、会话、稳定性) 多进程 Session 管理系统 + REST API 控制面 抓取/测试需要隔离 Session(cookies/storage) 沙箱浏览器实例、Cookie/Storage 隔离 自动化流程难跨团队复用 Worklet 模块化机制 难监控执行过程(错误、耗时) 可观测性与可记录的 API 调用流程 本地脚本难扩展到团队/生产规模 Service 化、Docker 部署、可水平扩展
4. 架构 4.1 产品总体架构图
Wyse Browser — Architecture Overview
External Systems
• LLMs / AI Agents
• RPA / Automation Systems
• Backend Services
• Observability / Monitoring Systems
REST Control Plane
• /api/session • /api/flow • /api/browser
Flow Engine & Worklet Runtime
• Worklet Loader / Registry
• Sequential / Conditional Flow
• Execution Logs / Telemetry
• Error Handling / Retry / Recovery
Browser Runtime
• Playwright Controller
• Chromium Sandbox Processes
• Storage / Cookie Isolation Per Session
Infrastructure & Deployment
Docker • K8s • Scaling • Metrics • Logging
4.2 模块分层图
Wyse Browser — Product Module Layers
1. Integration Layer
• REST API Gateway • Auth / Tokens • SDKs (JS / Python)
2. Orchestration Layer
• Flow Engine • Execution Graph • Observability Hooks
• Step Scheduler • Retry Policies • Logging
3. Worklet Runtime
• Worklet Registry • Sandbox Execution
• Shared Interfaces (click, fill, navigate, query, screenshot)
4. Browser Runtime
• Playwright Adapter • Chromium Manager
• Session Isolation • Resource Limits • Crash Recovery
5. Deployment & Ops Layer
Docker • K8s • Autoscaling • Logs • Metrics
五、总结 Wyse Browser 不是单纯的浏览器库,而是一个面向 AI agent 的执行层:把浏览器操作服务化、可编排与可扩展,适合需要将 LLM/agent 输出可靠地映射为浏览器行为的场景。README 文档对架构、Worklet 概念与 REST API 有清晰说明,仓库也提供容器化启动路径(Dockerfile)与 MIT 许可,利于快速试验与商业化探索
标签:infra , ai