browser-use

browser-harness

AI🌱 NEW PROJECT BOOST#LLM#Browser Automation#Python #Agents

// 项目简介

Browser Harness 通过轻量级且可编辑的 CDP 接口，在 LLM 与浏览器之间建立了直接连接。该系统允许智能体在执行过程中编写并改进其辅助函数，以处理复杂的任务。用户可以利用此框架实现浏览器工作流的自动化，同时构建一个可复用的、由智能体生成的领域技能库。

// 技术分析

Browser Harness 被设计为一个轻量级、可编辑的基于 CDP 的接口，将 LLM 直接连接到真实浏览器，优先考虑完全的操作自由度。通过允许 Agent 在执行过程中编写自己的辅助函数和特定领域的技能，该项目创建了一个自我改进的循环，最大限度地减少了人工干预的需求。这种架构将浏览器自动化的负担从静态脚本转移到了动态的、由 Agent 编写的代码上，有效地解决了传统 Web 自动化工具中常见的脆弱性问题。

// 核心亮点

提供到 Chrome 的直接、轻量级 WebSocket 连接，无需中间层即可实现完全的浏览器控制。

使 Agent 能够实时编写和优化自己的自定义辅助函数，以处理缺失的功能。

具有自我改进的技能系统，Agent 可将成功的任务流程保存为可重用的特定领域模块。

支持远程浏览器集成，内置代理和验证码解决功能，以实现隐蔽性和部署。

保持约 592 行 Python 代码的紧凑代码库，确保透明度和易于维护。

鼓励社区驱动的增长，允许用户共享针对常见 Web 平台的 Agent 生成的技能文件夹。

// 典型使用场景

通过 CDP 实现 LLM 对浏览器的直接控制

支持自我改进的智能体辅助脚本

可复用的领域特定自动化技能

// 快速开始

首先，请按照 install.md 中的说明引导浏览器连接，并将存储库链接到您的本地 Chrome 实例。使用提供的设置提示词配合 Claude Code 等由 LLM 驱动的编码助手来自动化初始配置。安装完成后，您可以执行任务，并允许 Agent 在 agent-workspace 目录中自动生成并保存特定领域的技能。