browser-use开源程序使 AI 代理可以访问网站,自动完成特定的指定任务,告诉您的计算机该做什么,它就会完成它。

一、软件介绍

文末提供程序和源码下载

      browser-use开源程序使 AI 代理可以访问网站,自动完成特定的指定任务,浏览器使用是将AI代理与浏览器连接的最简单方法。告诉您的计算机该做什么,它就会完成它。

二、快速开始

使用 pip (Python>=3.11):

pip install browser-use
Install Playwright:  安装 Playwright:

playwright install chromium
Spin up your agent:  启动您的代理:

from langchain_openai import ChatOpenAI
from browser_use import Agent
import asyncio
from dotenv import load_dotenv
load_dotenv()

async def main():
    agent = Agent(
        task="Compare the price of gpt-4o and DeepSeek-V3",
        llm=ChatOpenAI(model="gpt-4o"),
    )
    await agent.run()

asyncio.run(main())
Add your API keys for the provider you want to use to your .env file.
将要使用的提供程序的 API 密钥添加到 .env 文件中。

OPENAI_API_KEY=
ANTHROPIC_API_KEY=
AZURE_ENDPOINT=
AZURE_OPENAI_API_KEY=
GEMINI_API_KEY=
DEEPSEEK_API_KEY=

 使用 UI 进行测试

简单地运行 gradio 示例:

uv pip install gradio
python examples/ui/gradio_demo.py

三、演示

任务 :将杂货添加到购物车,然后结帐。

提示:将我最新的 LinkedIn 关注者添加到 Salesforce 中的潜在客户中。

提示 :阅读我的简历并找到 ML 工作,将它们保存到一个文件中,然后在新的标签页中开始申请它们,如果你需要帮助,就问我。

提示 :在 Google Docs 中写一封信给我爸爸,感谢他所做的一切,并将文档保存为 PDF

提示 :在 Hugging face 上查找具有 cc-by-sa-4.0 许可证的模型,并按点赞数排序,将前 5 名保存到文件中

四、其他

Agent  代理
 Improve agent memory (summarize, compress, RAG, etc.)
改进代理内存(summarize、compress、RAG 等)
 Enhance planning capabilities (load website specific context)
增强规划功能(加载网站特定上下文)
 Reduce token consumption (system prompt, DOM state)
减少 Token 消耗(系统提示符、DOM 状态)
DOM Extraction  DOM 提取
 Improve extraction for datepickers, dropdowns, special elements
改进日期选择器、下拉列表、特殊元素的提取
 Improve state representation for UI elements
改进 UI 元素的状态表示
Rerunning tasks  重新运行任务
 LLM as fallback  LLM作为 fallback
 Make it easy to define workflow templates where LLM fills in the details
轻松定义工作流模板,其中LLM填写详细信息
 Return playwright script from the agent
从代理处返回 playwauthor 脚本
Datasets  数据
 Create datasets for complex tasks
为复杂任务创建数据集
 Benchmark various models against each other
将各种模型相互进行基准测试
 Fine-tuning models for specific tasks
针对特定任务微调模型
User Experience  用户体验
 Human-in-the-loop execution
人机交互执行
 Improve the generated GIF quality
提高生成的 GIF 质量
 Create various demos for tutorial execution, job application, QA testing, social media, etc.
为教程执行、工作申请、QA 测试、社交媒体等创建各种演示。

五、软件下载

夸克网盘分享

本文信息来源于GitHub作者地址:https://github.com/browser-use/browser-use

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/75853.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

CAD格式转换器:Acme CAD Converter

Acme CAD Converter 是一款专业的多功能 CAD 文件管理工具,支持 ‌DWG/DXF/DWF 文件查看、批量格式转换及版本降级‌,适用于工程设计、图纸归档等场景‌。软件兼容 AutoCAD R2.5 至 2023 版本文件‌,可输出为 PDF、JPEG、TIFF、SVG 等 20 格式…

vmware虚拟机上Ubuntu或者其他系统无法联网的解决方法

一、检查虚拟机是否开启了网络服务 打开方式:控制面板->-管理工具--->服务 查找 VMware DHCP Service 和VMware NAT Service ,确保这两个服务已经启动。如下图,没有启动就点击启动。 二、设置网络类型 我们一般使用前两种多一些&…

数据结构与算法:基础与进阶

🌟 各位看官好,我是maomi_9526! 🌍 种一棵树最好是十年前,其次是现在! 🚀 今天来学习C语言的相关知识。 👍 如果觉得这篇文章有帮助,欢迎您一键三连,分享给更…

使用分布式锁和乐观锁解决超卖问题

在电商、秒杀等高并发场景中,“超卖”问题指库存被过量扣减,导致实际库存不足。以下是使用 分布式锁 和 乐观锁 解决超卖问题的原理与实现方案: 一、超卖问题的核心原因 多个并发请求同时读取库存余量,并在本地计算后发起写操作&…

盛水最多的容器

本题有两种解法,一种是暴力解法,直接暴力枚举出所有的体积比较出最大的即可,但是时间复杂度达到n方。超出了限制,另一种解法就是利用单调性解法,我们着重介绍一下单调性解法。 单调性解法: 体积vh*w&…

操作系统概述(3)

批处理系统 1.单道批处理系统 单道批处理系统是成批地处理作用,并且始终只有一道作业在内存中的系统。优点:提高系统资源的利用率和系统吞吐量。缺点:系统中的资源得不到充分利用。 2.多道批处理系统 引入多道程序设计技术,是…

数字身份DID协议:如何用Solidity编写去中心化身份合约

本文提出基于以太坊的自主主权身份(SSI)实现方案,通过扩展ERC-734/ERC-735标准构建链上身份核心合约,支持可验证声明、多密钥轮换、属性隐私保护等特性。设计的三层架构体系将身份控制逻辑与数据存储分离,在测试网环境…

【目标检测】【深度学习】【Pytorch版本】YOLOV2模型算法详解

【目标检测】【深度学习】【Pytorch版本】YOLOV2模型算法详解 文章目录 【目标检测】【深度学习】【Pytorch版本】YOLOV2模型算法详解前言YOLOV2的模型结构YOLOV2模型的基本执行流程YOLOV2模型的网络参数YOLOV2模型的训练方式 YOLOV2的核心思想前向传播阶段反向传播阶段 总结 前…

第421场周赛:数组的最大因子得分、

Q1、数组的最大因子得分 1、题目描述 给你一个整数数组 nums。 因子得分 定义为数组所有元素的最小公倍数(LCM)与最大公约数(GCD)的 乘积。 在 最多 移除一个元素的情况下,返回 nums 的 最大因子得分。 注意&…

机器学习(神经网络基础篇)——个人理解篇5(梯度下降中遇到的问题)

在神经网络训练中,计算参数的梯度是关键步骤。numerical_gradient 方法旨在通过数值微分(中心差分法)计算损失函数对网络参数的梯度。然而,该方法的实现存在一个关键问题,导致梯度计算错误。 1、错误代码示例&#xf…

40常用控件_WindowFrame的影响

window frame 的影响 如果 widget 作为一个窗口(带有标题栏,最小化,最大化,关闭按钮),那么在计算尺寸和坐标的 时候就有两种算法.包含 window frame 和 不包含 window frame. 其中x(),y0,frameGeometry(), pos(),move() 都是按照包含 window frame 的方式来计算 的. 其中 geome…

Nginx搭建API网关服务教程-系统架构优化 API统一管理

超实用!用Nginx搭建API网关服务,让你的系统架构更稳更强大!🚀 亲们,今天来给大家种草一个超级实用的API网关搭建方案啦!👀 在如今的Web系统架构中,一个稳定、高性能、可扩展的API网…

USB设备老是提示有问题,如何解决

问题描述:有一台usb设备一旦不小心碰了下,后面就在右下角提示“无法识别的USB设备”“跟这台计算机连接的前一个USB设备0工作不正常,WIndows无法识别它”。我这个是明确知道那个设备,如果不知道也可以同样解决。 解决方法&#xf…

数据操作语言

一、DML的核心操作类型 1.添加数据(INSERT) (1)手动插入:逐行插入数据,适用于少量数据。 INSERT INTO 表名 (字段1, 字段2) VALUES (值1, 值2);(2)批量导入:通过外部文件导入数据,适用于大数据场景

【Python】案例:计算股票收益率和波动率

【Python】案例:计算股票收益率和波动率: 1、案例需求2、数据准备3、案例实现 1、案例需求 在分析股票数据时,我们需要从这些数据中得到一些关键指标进行评估,比如收益率、波动率,其中收益率又可以细分为简单收益率和…

geoserver搭建Docker一键直接安装并上传tif影像预览

geoserver搭建Docker一键直接安装 文章目录 geoserver搭建Docker一键直接安装前言一、Docker拉取Geoserver二、运行后使用geoserver进行数据管理进入geoserver调整语言登录geoserver上传一个tif影像建立工作空间并上传自己的tif数据建立图层预览 总结 前言 使用docker安装geos…

STM32看门狗应用实战:独立看门狗与窗口看门狗深度解析(下) | 零基础入门STM32第九十五步

主题内容教学目的/扩展视频看门狗什么是看门狗,原理分析,启动喂狗方法,读标志位。熟悉在程序里用看门狗。 师从洋桃电子,杜洋老师 📑文章目录 一、看门狗应用架构分析1.1 系统监控流程图1.2 双看门狗应用场景对比 二、…

nacos集群启动问题

根据您的描述,Nacos集群只能启动两个节点,可能的原因和解决方法如下: 1. 集群配置问题 • 原因:cluster.conf文件中可能只配置了两个节点的地址,导致第三个节点无法加入集群。 • 解决方法: • 检查每个…

【C语言】跳台阶

相信你是最棒哒!!! 一、题目描述 二、题目代码 1.斐波那契数列 2.DFS深度搜索 总结 一、题目描述 一只青蛙一次可以跳上1级台阶,也可以跳上2级。求该青蛙跳上一个n级的台阶总共有多少种跳法(先后次序不同算不同的结果…

指纹浏览器技术架构解析:高并发批量注册业务的工程化实践——基于分布式指纹引擎与防关联策略的深度实现

一、技术背景与行业痛点 在跨境电商、广告投放、问卷调查等场景中,批量注册与多账号矩阵运营已成为刚需。然而,主流平台(如亚马逊、Facebook、Google)的风控系统通过浏览器指纹追踪(Canvas/WebGL/WebRTC等&#xff09…