https://github.com/WyseOS/wyse-browser

1. 产品定位

Wyse Browser 是一个 专为 AI Agents、自动化系统和可编排任务(flows)打造的浏览器执行层(Browser Runtime Layer)
通过多进程沙箱浏览器、REST API、可复用 Worklets,以及可横向扩展的执行架构,使 LLM / Agent 能够稳定、可控、可观测地操作真实网页。

“让任何 LLM 在真实互联网环境中可控地执行操作。”


2. 目标用户

核心用户

  • AI Agent 平台(自研 或 SaaS)
  • AI 原生产品团队:需要让 LLM 执行真实网页任务
  • 自动化工程 / RPA 团队
  • 数据抓取 / 爬虫 / 增量监控系统
  • QA / 自动化测试团队(多会话并发测试)

扩展用户

  • 内部工具团队:运营、风控、营销等需要自动化网页流程

3. 核心价值

用户痛点Wyse 的解决方式
AI 输出难稳定落地为真实网页操作Worklets + Flows 将自然语言指令结构化为可重复执行的步骤
多浏览器实例难管理(资源、会话、稳定性)多进程 Session 管理系统 + REST API 控制面
抓取/测试需要隔离 Session(cookies/storage)沙箱浏览器实例、Cookie/Storage 隔离
自动化流程难跨团队复用Worklet 模块化机制
难监控执行过程(错误、耗时)可观测性与可记录的 API 调用流程
本地脚本难扩展到团队/生产规模Service 化、Docker 部署、可水平扩展

4. 架构

4.1 产品总体架构图

Wyse Browser — Architecture Overview External Systems • LLMs / AI Agents • RPA / Automation Systems • Backend Services • Observability / Monitoring Systems REST Control Plane • /api/session • /api/flow • /api/browser Flow Engine & Worklet Runtime • Worklet Loader / Registry • Sequential / Conditional Flow • Execution Logs / Telemetry • Error Handling / Retry / Recovery Browser Runtime • Playwright Controller • Chromium Sandbox Processes • Storage / Cookie Isolation Per Session Infrastructure & Deployment Docker • K8s • Scaling • Metrics • Logging

4.2 模块分层图

Wyse Browser — Product Module Layers 1. Integration Layer • REST API Gateway • Auth / Tokens • SDKs (JS / Python) 2. Orchestration Layer • Flow Engine • Execution Graph • Observability Hooks • Step Scheduler • Retry Policies • Logging 3. Worklet Runtime • Worklet Registry • Sandbox Execution • Shared Interfaces (click, fill, navigate, query, screenshot) 4. Browser Runtime • Playwright Adapter • Chromium Manager • Session Isolation • Resource Limits • Crash Recovery 5. Deployment & Ops Layer Docker • K8s • Autoscaling • Logs • Metrics

五、总结

Wyse Browser 不是单纯的浏览器库,而是一个面向 AI agent 的执行层:把浏览器操作服务化、可编排与可扩展,适合需要将 LLM/agent 输出可靠地映射为浏览器行为的场景。README 文档对架构、Worklet 概念与 REST API 有清晰说明,仓库也提供容器化启动路径(Dockerfile)与 MIT 许可,利于快速试验与商业化探索

标签:infra, ai

你的评论