跳转到主要内容

浏览器自动化

Myrm Agent 可自主浏览网页、填表、提取数据并执行操作。

浏览器引擎

双隐身引擎(Patchright + Camoufox) — 站点拦截默认 Chromium 路径时,Myrm 可热切换到基于 Firefox 的隐身引擎,且不丢失登录 Cookie,已认证工作流不会跳回登录页。 三层交互栈:
  1. 无头 Chrome / Camoufox — 完整渲染,含反爬回退
  2. DOM 解析器 — 结构化内容提取(自愈定位器、Shadow DOM)
  3. 视觉 — 复杂 UI 的截图交互

能力

  • 导航到 URL
  • 点击元素、填写表单
  • 提取文本与结构化数据
  • 截图
  • 处理认证流程

凭证库(登录而不泄露密码)

需登录的站点与应用,在 设置 → 凭证 配置 表单凭证库 条目:
  1. 添加标签(如 company-admin)、密码与可选 TOTP 种子。
  2. 让 Agent 登录 — 仅引用标签。
  3. Myrm 在浏览器 DOM 或桌面输入层注入凭证;值不出现在对话中。
意义: 工具参数与聊天历史持久化。通过 type/fill"hunter2" 会把密码复制到日志、重试与上下文。基于标签的注入将秘密留在库边界内——与研究级浏览器库设计同原则,并扩展到桌面 Computer Use 与产品 GUI。

搜索集成

7 意图搜索系统理解不同检索需求:
  • 事实查询
  • 导航请求
  • 研究任务
  • 价格对比
  • 新闻动态
  • 图片搜索
  • 本地搜索

Computer Use

通过 Computer Use 协议实现桌面自动化,控制原生应用。