首页LLMbrowser-use/browser-harness
browser-use

browser-harness

AI🌱 NEW PROJECT BOOST#LLM#Browser Automation#Python#Agents
前往 GitHub →
26

// 项目简介

Browser Harness 通过轻量级且可编辑的 CDP 接口,在 LLM 与浏览器之间建立了直接连接。该系统允许智能体在执行过程中编写并改进其辅助函数,以处理复杂的任务。用户可以利用此框架实现浏览器工作流的自动化,同时构建一个可复用的、由智能体生成的领域技能库。

// 技术分析

Browser Harness 被设计为一个轻量级、可编辑的基于 CDP 的接口,将 LLM 直接连接到真实浏览器,优先考虑完全的操作自由度。通过允许 Agent 在执行过程中编写自己的辅助函数和特定领域的技能,该项目创建了一个自我改进的循环,最大限度地减少了人工干预的需求。这种架构将浏览器自动化的负担从静态脚本转移到了动态的、由 Agent 编写的代码上,有效地解决了传统 Web 自动化工具中常见的脆弱性问题。

// 核心亮点

01
提供到 Chrome 的直接、轻量级 WebSocket 连接,无需中间层即可实现完全的浏览器控制。
02
使 Agent 能够实时编写和优化自己的自定义辅助函数,以处理缺失的功能。
03
具有自我改进的技能系统,Agent 可将成功的任务流程保存为可重用的特定领域模块。
04
支持远程浏览器集成,内置代理和验证码解决功能,以实现隐蔽性和部署。
05
保持约 592 行 Python 代码的紧凑代码库,确保透明度和易于维护。
06
鼓励社区驱动的增长,允许用户共享针对常见 Web 平台的 Agent 生成的技能文件夹。

// 典型使用场景

01
通过 CDP 实现 LLM 对浏览器的直接控制
02
支持自我改进的智能体辅助脚本
03
可复用的领域特定自动化技能

// 快速开始

首先,请按照 install.md 中的说明引导浏览器连接,并将存储库链接到您的本地 Chrome 实例。使用提供的设置提示词配合 Claude Code 等由 LLM 驱动的编码助手来自动化初始配置。安装完成后,您可以执行任务,并允许 Agent 在 agent-workspace 目录中自动生成并保存特定领域的技能。