AgentReview:基于 LLM Agents 模拟同行评审过程的框架

❤️ 如果你也关注大模型与 AI 的发展现状,且对大模型应用开发非常感兴趣,我会快速跟你分享最新的感兴趣的 AI 应用和热点信息,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦


🚀 快速阅读

  1. AgentReview 是一个基于大型语言模型(LLM)的框架,用于模拟学术同行评审过程。
  2. 它模拟了评审者评估、作者回应、评审者讨论和领域主席决策等阶段。
  3. 通过模拟,AgentReview 探索和分离多种影响评审结果的变量,同时保护评审数据的隐私。

正文(附运行示例)

AgentReview 是什么

在这里插入图片描述

AgentReview 是一个基于大型语言模型(LLM)的框架,用于模拟学术同行评审过程。该框架通过模拟评审者、作者和领域主席(AC)的角色,支持研究者在尊重隐私的同时,探索评审偏见、角色和决策机制对评审结果的影响。AgentReview 能提供改进同行评审机制的洞见,支持未来的研究。

AgentReview 的主要功能

  • 模拟同行评审过程:AgentReview 模拟真实的学术同行评审流程,包括评审者评估、作者回应、评审者讨论和领域主席决策等阶段。
  • 角色模拟:框架内集成评审者、作者和领域主席(AC)三种角色,每种角色由 LLM 代理驱动,展现出不同的行为特征。
  • 多变量分析:基于模拟,AgentReview 探索和分离多种影响评审结果的变量,如评审者的承诺、意图和知识能力,及 AC 的决策风格。
  • 隐私保护:在模拟过程中,AgentReview 尊重评审数据的隐私性,不需要用真实的敏感评审数据。
  • 社会学理论验证:AgentReview 验证如社会影响理论、利他主义疲劳、群体思维和权威偏见等社会学理论在同行评审中的应用。

AgentReview 的技术原理

  • 大型语言模型(LLM):AgentReview 基于 LLM 构建,用语言理解和生成能力模拟评审者和作者的行为。
  • 代理建模:框架中的每个角色(评审者、作者、AC)都被建模为具有特定属性和行为的代理,代理根据预设的特性和规则进行交互。
  • 结构化评审流程:AgentReview 遵循结构化的五阶段评审流程,模拟从初步评审到最终决策的全过程。
  • 自定义和扩展性:框架设计为可扩展的,支持研究者根据需要自定义角色属性和评审流程。
  • 数据驱动的洞察:基于大规模模拟生成的数据,AgentReview 提供统计显著的洞察,支持内容和数值分析。

如何运行 AgentReview

安装

下载数据

下载两个 zip 文件:

  1. 下载 AgentReview_Paper_Data.zip 并解压到 data/ 目录下,包含论文 PDF 和真实世界 ICLR 2020 - 2023 的同行评审数据。
unzip AgentReview_Paper_Data.zip -d data/
  1. (可选)下载 AgentReview_LLM_Reviews.zip 并解压到 outputs/ 目录下,包含 LLM 生成的评审数据。
unzip AgentReview_LLM_Review.zip -d outputs/

安装所需包

cd AgentReview/
pip install -r requirements.txt

设置环境变量

如果你使用 OpenAI API,设置 OPENAI_API_KEY

export OPENAI_API_KEY=... # 格式: sk-...

如果你使用 AzureOpenAI API,设置以下变量:

export AZURE_ENDPOINT=...  # 格式: https://<your-endpoint>.openai.azure.com/
export AZURE_DEPLOYMENT=...  # 你的 Azure OpenAI 部署
export AZURE_OPENAI_KEY=... # 你的 Azure OpenAI 密钥

运行项目

设置 run.sh 文件中的环境变量并运行:

bash run.sh

注意:所有项目文件应从 AgentReview 目录运行。

示例代码

import agentreview.experiment_config as config# 设置实验配置
config.all_settings["your_setting_name"] = {
"setting_key": "setting_value",
# 添加其他设置项
}# 运行实验
from agentreview.experiment import run_experimentrun_experiment(config.all_settings["your_setting_name"])

资源

  1. 项目官网:https://agentreview.github.io/
  2. GitHub 仓库:https://github.com/Ahren09/AgentReview
  3. HuggingFace 模型库:https://huggingface.co/spaces/Ahren09/AgentReview
  4. arXiv 技术论文:https://arxiv.org/pdf/2406.12708

❤️ 如果你也关注大模型与 AI 的发展现状,且对大模型应用开发非常感兴趣,我会快速跟你分享最新的感兴趣的 AI 应用和热点信息,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/60307.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何查看电脑关机时间

要查看电脑的关机时间&#xff0c;可以按照以下步骤进行操作&#xff1a; 1. 打开事件查看器&#xff1a;按下键盘上的Windows键R键&#xff0c;然后在弹出的运行对话框中输入"eventvwr.msc"&#xff0c;并按下Enter键。 2. 在事件查看器窗口中&#xff0c;单击左侧窗…

详解Gemini API的使用:在国内实现大模型对话与目标检测教程

摘要&#xff1a;本博客介绍了如何利用Gemini API实现多轮对话和图像目标检测识别功能&#xff0c;在Python中快速搭建自己的大模型完成实际任务。通过详细的步骤解析&#xff0c;介绍了如何申请Gemini API密钥&#xff0c;调用API、对话实现的代码&#xff0c;给出了上传图片识…

java操作ES(一)RestHighLevelClient(2)集成与demo

一、集成方法 1、pom依赖 <dependency><groupId>org.elasticsearch.client</groupId><artifactId>elasticsearch-rest-high-level-client</artifactId><version>7.x.x</version> <!-- 请使用与你的Elasticsearch版本相匹配的版…

HashMap的put流程知道吗

HashMap 的 put 方法算是 HashMap 中比较核心的功能了&#xff0c;复杂程度高但是算法巧妙&#xff0c;同时在上一版本的基础之上优化了存储结构&#xff0c;从链表逐步进化成了红黑树&#xff0c;以满足存取性能上的需要。本文逐行分析了 put 方法的执行流程&#xff0c;重点放…

5. ARM_指令集

概述 分类 汇编中的符号&#xff1a; 指令&#xff1a;能够编译生成一条32位机器码&#xff0c;并且能被处理器识别和执行伪指令&#xff1a;本身不是指令&#xff0c;编译器可以将其替换成若干条指令伪操作&#xff1a;不会生成指令&#xff0c;只是在编译阶段告诉编译器怎…

uniapp的基本使用(easycom规范和条件编译)和uview组件的安装和使用

文章目录 1、uniapp1.uview组件安装2.uview-plus组件安装 2、条件编译3、easycom规范1.组件路径符合规范2.自定义easycom配置的示例 总结 1、uniapp UniApp的UI组件库&#xff0c;如TMUI、uViewUI、FirstUI、TuniaoUI、ThorUI等&#xff0c;这些组件库适用于Vue3和TypeScript&…

Vue 学习随笔系列十四 -- JavaScript巧妙用法

JavaScript巧妙用法 文章目录 JavaScript巧妙用法1、String.padStart 函数2、String.padEnd 函数3、tirm 函数3. Object.freeze 函数4. Object.fromEntries 函数5. Object.entries 函数6. Array.prototype.flat 函数 1、String.padStart 函数 在字符串前面进行填充 let temp …

理想汽车Android面试题及参考答案

请解释一下 Android 中的 Handler 是如何工作的 在 Android 中,Handler 主要用于在不同线程之间进行通信,特别是在主线程(UI 线程)和工作线程之间。 Handler 是基于消息队列(MessageQueue)和 Looper 来工作的。首先,Looper 是一个循环器,它会不断地从消息队列中取出消息…

docker运行ActiveMQ-Artemis

前言 artemis跟以前的ActiveMQ不是一个产品&#xff0c;原ActiveMQ改为ActiveMQ Classic, 现在的artemis是新开发的&#xff0c;和原来不兼容&#xff0c;全称&#xff1a;ActiveMQ Artemis 本位仅介绍单机简单部署使用&#xff0c;仅用于学习和本地测试使用 官网&#xff1a;…

终端应用开发沉思录

前言 以下所有分析皆是从我的视角出发&#xff0c;探讨下我现行局势下觉得最有可能的实现且有未来发展前景的技术方案。由于本人没有啥开发经验&#xff0c;所以多是纸上谈兵&#xff0c;仅仅记录和分享下我个人想法。 移动App的开发模式&#xff1a; 在技术选型上&#xff…

商场试衣间惊现隐藏摄像头:小澄检测仪助力博主影子揭露

在信息时代&#xff0c;隐私安全如同一座需要时刻守护的堡垒。然而&#xff0c;近期公共场所出现的针孔摄像头事件&#xff0c;让这座堡垒遭受了严峻冲击。科普博主影子不会说谎近日发布视频&#xff0c;再度曝光隐藏在商场服装店试衣间的针孔摄像头&#xff0c;引发公众关注。…

数据分析那些事儿——关于A/B实验

数据分析那些事儿——A/B实验及实验中的辛普森悖论&#xff1f;如何避免 1、A/B实验分组方法2、注意事项3、A/B实验中的辛普森悖论&#xff1f;如何避免&#xff1f; A/B实验是一种用于比较A和B&#xff08;可以是两个版本的网页、应用程序或其他产品&#xff09;以确定哪个版本…

【MATLAB仿真】基于matlab的圆形阵列的波束形成进行仿真

摘要 本文研究了基于圆形阵列的波束形成技术&#xff0c;并利用MATLAB对其进行仿真分析。圆形阵列波束形成在现代无线通信、雷达和声学等领域具有广泛的应用&#xff0c;能够有效提高信号的方向性和抗干扰能力。本文通过改变阵列半径及入射角&#xff0c;对波束图进行了仿真分…

遗传算法与深度学习实战(23)——利用遗传算法优化深度学习模型

遗传算法与深度学习实战&#xff08;23&#xff09;——利用遗传算法优化深度学习模型 0. 前言1. 神经进化2. 使用遗传算法作为深度学习优化器小结系列链接 0. 前言 神经进化涵盖了所有用于改进深度学习的进化算法。更具体地说&#xff0c;神经进化用来定义应用于深度学习的特…

AG32 FPGA部分简单开发

环境 Quartus 13.0&#xff08;Quartus 不能使用Lite 版本&#xff0c;需要使用Full 版本&#xff09;AGM SDKSupra&#xff08;快捷方式在SDK目录下&#xff0c;具体路径为AgRV_pio\packages\tool-agrv_logic\bin&#xff09; FPGA编程 在AG32芯片中&#xff0c;拥有异构双…

github使用基础

要通过终端绑定GitHub账号并进行文件传输&#xff0c;你需要使用Git和SSH密钥来实现安全连接和操作。以下是一个基本流程&#xff1a; 设置GitHub和SSH 检查Git安装 通过终端输入以下命令查看是否安装Git&#xff1a; bash 复制代码 git --version配置Git用户名和邮箱 bash …

hive修改表名、修改列名、修改分区

文章目录 一、修改表二、修改列三、修改分区 官网地址&#xff1a;https://cwiki.apache.org/confluence/display/Hive/GettingStarted#GettingStarted-AlteringandDroppingTables 一、修改表 1、重命名表名 ALTER TABLE table_name RENAME TO new_table_name示例: 将user表…

告别复杂协作:Adobe XD的简化替代方案

Adobe XD是一款集成UI/UX设计和原型创建功能的设计平台。它允许用户进行网页、移动应用的设计&#xff0c;以及原型的绘制&#xff0c;并且能够将静态设计转化为动态的交互原型。尽管Adobe XD提供了这些功能&#xff0c;但它依赖于第三方插件&#xff0c;且插件库有限&#xff…

React Hooks在现代前端开发中的应用

&#x1f493; 博客主页&#xff1a;瑕疵的CSDN主页 &#x1f4dd; Gitee主页&#xff1a;瑕疵的gitee主页 ⏩ 文章专栏&#xff1a;《热点资讯》 React Hooks在现代前端开发中的应用 React Hooks在现代前端开发中的应用 React Hooks在现代前端开发中的应用 引言 React Hooks …

ASR+LLM+TTS在新能源汽车中的实战

ASRLLMTTS在新能源汽车中的实战解决方案&#xff0c;已经在路面上大规模应用&#xff0c;下面简单介绍一下&#xff1a; 实战案例 以下是一些国内新能源车机里 ASRLLMTTS 的案例&#xff1a; 蔚来&#xff1a; 蔚来的车机系统在智能语音交互方面有较为出色的应用。其 ASR 技…