Browser-Use WebUI项目启动指南

摘要

此前发布《Browser - Use WebUI 使用体验》博文后,鉴于部分朋友运行时出现问题,重新运行并整理相关内容。本文详细记录 Web UI 项目启动全过程,涵盖 Python 3.11+、Chrome 浏览器及 API Keys 等环境要求,Python 环境检查、依赖安装等环境配置步骤,.env 文件中环境变量的设置方法。同时,针对启动中如 lxml.html.clean 依赖缺失、连接被拒等问题给出解决方案,介绍启动命令、访问方式、故障排查建议,以及日志级别设置与支持的 LLM 模型等,还提供官方文档供参考 。

引言

之前写了一篇《Browser-Use WebUI 使用体验》的博文,有些朋友可能在运行过程中出现了一些问题,所以今天,我重新运行了一次,并对其中可能出现的问题,简单整理了一下:

Web UI 项目启动指南

本文档记录了启动 Web UI 项目的完整过程,包括环境配置、遇到的问题及其解决方案。

1. 环境要求

  • Python 3.11 或更高版本
  • Chrome 浏览器(用于浏览器自动化)
  • 相关 API Keys(支持多个 LLM 提供商)

2. 环境配置

2.1 Python 环境检查

python --version
# 输出: Python 3.11.5

2.2 安装项目依赖

pip install -r requirements.txt

依赖包括:

  • browser-use==0.1.18
  • langchain-google-genai==2.0.8
  • pyperclip==1.9.0
  • gradio==5.9.1
  • langchain-ollama==0.2.2
  • langchain-openai==0.2.14

3. 环境变量配置

在项目根目录创建 .env 文件,配置以下环境变量:

# LLM API 配置
OPENAI_ENDPOINT=https://api.openai.com/v1
OPENAI_API_KEY=  # 可选ANTHROPIC_API_KEY=  # 可选GOOGLE_API_KEY= 替换为你的key # 已配置AZURE_OPENAI_ENDPOINT=  # 可选
AZURE_OPENAI_API_KEY=  # 可选DEEPSEEK_ENDPOINT=https://api.deepseek.com
DEEPSEEK_API_KEY=t替换为你的key # 已配置# Chrome 配置
CHROME_PATH="C:\Users\[你的用户名]\AppData\Local\Google\Chrome\Application\chrome.exe"
CHROME_USER_DATA="C:\Users\[你的用户名]\AppData\Local\Google\Chrome\User Data"
CHROME_DEBUGGING_PORT=9222
CHROME_DEBUGGING_HOST=localhost
CHROME_PERSISTENT_SESSION=false  # 设置为 true 可以在 AI 任务之间保持浏览器打开# 显示设置
RESOLUTION=1920x1080x24
RESOLUTION_WIDTH=1920
RESOLUTION_HEIGHT=1080# VNC 设置
VNC_PASSWORD=youvncpassword

4. 启动过程中遇到的问题及解决方案

4.1 依赖问题:lxml.html.clean

问题描述
启动时遇到 ImportError:

ImportError: lxml.html.clean module is now a separate project lxml_html_clean.
Install lxml[html_clean] or lxml_html_clean directly.

解决方案
安装缺失的依赖:

pip install "lxml[html_clean]"
pip install lxml_html_clean

4.2 连接被拒绝问题

问题描述
使用默认的 127.0.0.1 地址时,无法访问 Web UI(ERR_CONNECTION_REFUSED)。

解决方案

  1. 检查服务是否正常运行:
netstat -ano | findstr :7788
  1. 使用 0.0.0.0 替代 127.0.0.1:
python webui.py --ip 0.0.0.0 --port 7788

5. 启动命令

完整的启动命令如下:

python webui.py --ip 0.0.0.0 --port 7788

6. 访问方式

服务启动后,可以通过以下方式访问:

  1. http://localhost:7788
  2. http://127.0.0.1:7788
  3. http://[本机IP]:7788

7. 故障排查建议

如果无法访问 Web UI,请检查:

  1. 确保服务正在运行
  2. 检查防火墙设置,确保端口 7788 未被阻止
  3. 如果使用代理,尝试关闭代理后访问
  4. 尝试在浏览器无痕模式下访问
  5. 查看服务日志,寻找可能的错误信息

8. 日志级别设置

.env 文件中,可以通过设置 BROWSER_USE_LOGGING_LEVEL 来调整日志级别:

  • result:仅显示结果
  • debug:显示详细调试信息
  • info:显示一般信息(默认)

9. 支持的 LLM 模型

当前配置支持以下 LLM 模型:

  1. Google Gemini(已配置)
  2. DeepSeek(已配置)
  3. OpenAI(需要配置 API key)
  4. Anthropic(需要配置 API key)
  5. Azure OpenAI(需要配置 endpoint 和 API key)

其他问题,可以参考官方文档

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/67992.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Grafana系列之Dashboard:新增仪表板、新增变量、过滤变量、变量查询、导入仪表板、变量联动、Grafana Alert

概述 关于Prometheus和Grafana的安装,略过。 写在前面 Dashboard:仪表板,可包含多个PanelPanel:面板,Dashboard中的组件 如有写得不对的地方,烦请指出。 新增仪表板 点击右上角的 选择New dashboard…

使用 Ansys Discovery 对离心风机进行仿真

了解设置模拟并获得有用结果的步骤。 离心风机:基础知识和重要性 离心风机,也称为径流式风机,是旨在通过将动能转化为势能来增加空气或气体的压力和流量的机械装置。它们的工作原理是利用旋转叶轮产生的离心力轴向吸入空气,然后…

客户案例:向导ERP与金蝶云星空集成方案

一、客户背景 该客户公司主要致力于黄金、铂金、金镶玉首饰的研发设计、生产加工、批发及直营加盟业务。公司总部占地面积目前已达6000多平方米,拥有标准生产厂房和现代化生产设施,拥有一支完善的企业管理团队和专业技工队伍。 该企业目前同时采用向导 E…

机器学习-K近邻算法

文章目录 一. 数据集介绍Iris plants dataset 二. 代码三. k值的选择 一. 数据集介绍 鸢尾花数据集 鸢尾花Iris Dataset数据集是机器学习领域经典数据集,鸢尾花数据集包含了150条鸢尾花信息,每50条取自三个鸢尾花中之一:Versicolour、Setosa…

【豆包MarsCode蛇年编程大作战】花样贪吃蛇

目录 引言 展示效果 prompt提示信息 第一次提示(实现基本功能) 初次实现效果 第二次提示(美化UI) 第一次美化后的效果 第二次美化后的效果 代码展示 实现在线体验链接 码上掘金使用教程 体验地址: 花样贪吃蛇…

小白爬虫——selenium入门超详细教程

目录 一、selenium简介 二、环境安装 2.1、安装Selenium 2.2、浏览器驱动安装 三、基本操作 3.1、对页面进行操作 3.1.1、初始化webdriver 3.1.2、打开网页 3.1.3、页面操作 3.1.4、页面数据提取 3.1.5、关闭页面 ?3.1.6、综合小案例 3.2、对页面元素进行操作 3…

U3D的.Net学习

Mono:这是 Unity 最初采用的方式,它将 C# 代码编译为中间语言 (IL),然后在目标平台上使用虚拟机 (VM) 将其转换为本地机器码执行。 IL2CPP:这是一种较新的方法,它会将 C# 代码先编译为 C 代码,再由 C 编译器…

Java集合学习:HashMap的原理

一、HashMap里的Hash是什么? 首先,我们先要搞清楚HashMap里的的Hash是啥意思。 当我们在编程过程中,往往需要对线性表进行查找操作。 在顺序表中查找时,需要从表头开始,依次遍历比较a[i]与key的值是否相等&#xff…

SOAFEE 技术研讨会:汽车软件定义与自动驾驶技术探讨

在本次技术研讨会上,来自汽车与科技领域的专家们围绕汽车软件定义及自动驾驶技术展开了深入交流与探讨。从 SOAFEE 蓝图计划的创新性理念,到 Autoware 开源项目及 Open AD Kit 在实际应用中的探索,再到 Edge Workload Abstraction and Orches…

FastJson很快,有什么用?

FastJson 在国内的热度还是挺高的,受到了很多开发者的喜欢。不过,我自己倒没有在项目中用过。我记得刚工作那会新做的一个项目有明确规定禁止使用 FastJson。 昨天看到一篇关于 FastJson 的文章,这位朋友分享了自己在使用 FastJson 遇到的一…

Jetson nano 安装 PCL 指南

本指南帮助 ARM64 架构的 Jetson Nano 安装 PCL(点云库)。 安装步骤 第一步:安装依赖 在终端中运行以下命令,安装 PCL 所需的依赖: sudo apt-get update sudo apt-get install git build-essential linux-libc-dev s…

ansible自动化运维实战--软件包管理模块、服务模块、文件模块和收集模块setup(4)

文章目录 一、软件包管理模块1.1、功能1.2、常用参数1.3、示例 二、服务模块2.1、功能2.2、服务模块常用参数2.3、示例 三、文件与目录模块3.1、file功能3.2、常用参数3.3、示例 四、收集模块-setup4.1、setup功能4.2、示例 一、软件包管理模块 1.1、功能 Ansible 提供了多种…

终极的复杂,是简单

软件仿真拥有最佳的信号可见性和调试灵活性,能够高效捕获很多显而易见的常见错误,被大多数工程师熟练使用。 空间领域应用的一套数据处理系统(Data Handling System),采用抗辐FPGA作为主处理器,片上资源只包含10752个寄存器,软仿也是个挺花时间的事。 Few ms might take …

开关电源设计(2)–BUCK电路设计和计算过程

BUCK电路也即降压电路,是应用最广泛的DC-DC变换器 需求决定的参数 V i 和 V o V_{i} 和V_{o} Vi​和Vo​ f f f I o I_{o} Io​ 输出电压纹波率 效率 需要计算:电感量 r r r 占空比 C 参数计算: 当MOS管导通时,电感电压 V O N V i − …

cudatex文本编辑器

一、下载 通过网盘分享的文件:cudatext 链接: https://pan.baidu.com/s/1TZbGk3AM09SuKvvcQy0d6Q?pwdbbzd 提取码: bbzd 本链接分享的为2025年1月下载上传的软件,版本为1.220.6.1 ;软件皆已放入中文包。 二、设置中文简体 打开 https://…

C语言文件操作:标准库与系统调用实践

目录 1、C语言标准库文件操作 1.1.题目要求: 1.2.函数讲解: fopen 函数原型 参数 常用的打开模式 返回值 fwrite函数 函数原型 参数 返回值 注意事项 fseek函数 函数原型 参数 返回值 fread函数 函数原型 参数 返回值 fclose 函数…

一款专业通用开源的MES生产执行管理系统

系统简介 MES系统是一款B/S结构、开源、免费的生产执行管理系统。 此系统基于本人多年离散智造行业的业务经验及J2EE项目经验开发。 主要目的是为国内离散制造业的中小企业提供一个专业化、通用性、低成本的MES系统解决方案。 系统将提供“售前”、“实施”、“用户培训”、…

SpringBoot集成Flink-CDC,实现对数据库数据的监听

一、什么是 CDC ? CDC 是Change Data Capture(变更数据获取)的简称。 核心思想是,监测并捕获数据库的变动(包括数据或数据表的插入、 更新以及删除等),将这些变更按发生的顺序完整记录下来&…

Three城市引擎地图插件Geo-3d

一、简介 基于Three开发,为Three 3D场景提供GIS能力和城市底座渲染能力。支持Web墨卡托、WGS84、GCJ02等坐标系,支持坐标转换,支持影像、地形、geojson建筑、道路,植被等渲染。支持自定义主题。 二、效果 三、代码 //插件初始化…

应用层协议 HTTP 讲解实战:从0实现HTTP 服务器

🌈 个人主页:Zfox_ 🔥 系列专栏:Linux 目录 一:🔥 HTTP 协议 🦋 认识 URL🦋 urlencode 和 urldecode 二:🔥 HTTP 协议请求与响应格式 🦋 HTTP 请求…