论文导读 | 10月专题内容精选：人的预测

论文导读 | 10月专题内容精选：人的预测

news/2025/4/27 17:00:38/文章来源:https://blog.csdn.net/weixin_53463894/article/details/134606469

编者按

本次论文导读，编者选择了10月份OR和MS上与"人的预测"有关的三篇文章，分别涉及群体智慧的提取，个体序列预测的评估，以及决策者对风险的扭曲感知在分布式鲁棒优化中的应用。其中，从基于"生成式可能世界状态模型"(GPWM)进行群体预测的聚合，到使用严格的序贯检验模型来比较预测者的表现，本次选取的三篇文章对"人的预测"相关的数学建模、统计分析及其在优化问题中的应用都有一定启发，希望能引起相关读者的兴趣。

推荐文章1

● 题目：A Bayesian Hierarchical Model of Crowd Wisdom Based on Predicting Opinions of Others

基于他人意见预测的群体智慧贝叶斯层次模型

● 期刊：Management Science

● 原文链接：https://doi.org/10.1287/mnsc.2023.4955

● 发表日期：October 19, 2023

● 作者：John McCoy, Drazen Prelec

● 关键词：

◦ Wisdom of crowds 群体智慧

◦ Expertise 专家知识

◦ Bayesian hierarchical model 贝叶斯层次模型

◦ Surprisingly popular answer 令人惊讶的流行答案

● 主要内容：

本文的背景知识是关于群体智慧的提取方法和挑战。群体智慧是指多个人的集体智慧比单个个体更强大，可以应用于企业决策、市场研究、公共政策和医疗保健等领域。文章介绍了一些提取群体智慧的方法，如统计聚合信息和识别专业知识。然而，这些方法存在一些弱点，如无法考虑个体之间的信息差异和洞察力差异，以及无法准确获取世界先验知识和信号矩阵。文章提出了一种新的方法，称为generative possible worlds model (GPWM)，以解决这些问题。
本文的实现过程是通过引入、探索和实证验证generative possible worlds model (GPWM)。作者认为GPWM是将频率学派元素转化为贝叶斯群体智慧推断模型的自然而必要的一步。作者在多个实证数据集上评估了模型的性能，包括分类和概率数据，并将其与标准的单问题群体智慧方法以及现有的两个贝叶斯层次模型进行了比较。GPWM和现有的贝叶斯层次聚合模型之间的区别在于，现有的贝叶斯层次聚合模型将正确答案与共识联系起来，而GPWM则不做这个假设。现有的模型假设共识是正确答案，而GPWM允许多数信号在所有问题上都是错误的可能性。即使在这种极端情况下，GPWM原则上也可以恢复正确答案，因为人们对其他人的预测提供了关于正确信号的概率的额外信息。此外，现有的贝叶斯层次聚合模型依赖于学习受访者级别的参数，而GPWM可以使用关于他人的预测来推断问题级别的潜在参数，从而获得正确答案，而无需在多个问题上学习个体受访者的信息。

• 预测回答真的比例（即预测别人的预测）在GPWM模型中起到了重要的作用。根据论文中的信息，预测回答真的比例可以帮助揭示参与者对信息的共享程度以及谁拥有不被广泛共享的信息的信念。如果理性的参与者在预测自己处于少数派的情况下仍然给出特定的判断，那么这表明他们相信自己拥有不被广泛共享的知识或洞察力。通过比较投票预测和实际投票，可以帮助了解参与者对信息在群体中的普遍程度以及谁拥有不被广泛共享的信息的信念。此外，预测回答真的比例还可以帮助确定在不同可能的世界状态下，群体投票的分布情况。这对于正确解释群体中投票分布是必要的，因为仅仅知道群体中70%的人投票“是”并不能得出最佳答案是“是”，还需要知道在不同可能的世界状态下群体会如何投票。因此，预测回答真的比例在模型中有助于获取关于群体中投票分布的信息，从而提高群体智慧的准确性和可靠性。
作者在实验中采用了多个研究来评估模型的性能。根据论文中的信息，其中三个研究是关于美国州首府的问题，参与者需要判断每个问题的答案是真还是假，并预测回答真的比例。这三个研究分别在麻省理工学院和普林斯顿大学的实验室中进行。另外两个研究是关于20世纪艺术品市场价格的问题，一个研究中参与者是艺术专业人士，主要是画廊所有者，另一个研究中参与者是没有学习过艺术或艺术史课程的研究生。参与者需要判断90件20世纪艺术品的市场价格，并将其分为两个价格范围：低于30,000美元和高于30,000美元。在这些研究中，参与者除了回答问题和预测比例外，还需要给出他们的自信度。具体的实验协议和数据分析细节可以在论文的在线附录中找到。

推荐文章2

● 题目：Comparing Sequential Forecasters

比较序列时间预测者

● 期刊：Operations Research

● 原文链接：https://doi.org/10.1287/opre.2021.0792

● 发表日期：October 17, 2023

● 作者：Yo Joong Choe, Aaditya Ramdas

● 关键词：

◦ anytime valid sequential inference 任意时间有效的序贯推理

◦ confidence sequences 信心序列

◦ e-processes e-过程

◦ forecast evaluation 预测评估

◦ nonparametric statistics 非参数统计

● 主要内容：

◦ 本文的背景是关于预测能力比较的问题。文章指出，尽管预测在各个领域中非常普遍，但在如何正式比较不同预测者的预测能力方面并不明显，特别是在预测者针对一系列结果进行预测的顺序设置中。例如，文章提到了2019年世界大赛每场比赛的概率预测，但我们不清楚如何有效地建模随时间变化的棒球比赛结果，并且对于每个预测者如何得出预测也没有完整的信息。文章通过观察这些预测和结果的过程，使用置信区间序列来评估预测者之间的差异，并量化这种差异是否可以归因于偶然或运气。这种评估方法不需要对现实或预测方法做出假设。

◦ 本文设计了一种新颖的顺序推断程序，用于估计预测分数的时变差异。这些程序使用了连续监测的置信区间序列，这些序列在任意数据相关的停止时间点上都是有效的。置信区间的宽度是根据分数差异的底层方差自适应调整的。这些程序的构建基于博弈论统计框架，进一步识别了用于顺序检验弱零假设的e-processes和p-processes，即一个预测者在平均情况下是否优于另一个预测者。这些方法不对预测或结果做分布假设；主要定理适用于任何有界分数，而后续提供了针对无界分数的替代方法。

本文的模型主要是基于预测得分的差异来评估预测者的能力。模型定义了点预测得分差异和其经验估计。通过计算累积的差异和，可以构建一个鞅（martingale）。对于所有的时间点，通过构建指数测试超鞅（exponential test supermartingales），可以对累积的差异和进行统一且非渐近的界定，从而完成估计和覆盖。
停止时间的概念在本文中涉及是因为我们希望能够在任意数据依赖的停止时间上进行有效的推断和比较不同预测者的预测能力。在预测任务中，我们通常会在一定的时间范围内观察预测者的预测和实际结果。停止时间是指我们选择观察预测者的预测和实际结果的时间点。通过引入停止时间的概念，我们可以更准确地评估预测者的预测能力，并进行比较。这种方法可以避免在固定时间点上进行比较时可能出现的偏差和误导。因此，停止时间的概念在本文中起到了关键的作用。

本文使用真实数据进行了实证验证。在棒球方面，研究者比较了不同预测者对2019年世界大赛每场比赛的概率预测。在天气预报方面，研究者比较了不同预测者使用统计后处理方法的集合天气预报。此外，研究者还在模拟数据上验证了他们的方法，并与固定时间和渐近置信区间进行了比较。

推荐文章3

● 题目：Distributionally Robust Optimization Under Distorted Expectations

在扭曲期望下的分布式鲁棒优化

● 期刊：Operations Research

● 原文链接：https://doi.org/10.1287/opre.2020.0685

● 发表日期：October 10, 2023

● 作者：Jun Cai, Jonathan Yu-Meng Li, Tiantian Mao

● 关键词：

◦ distributionally robust optimization 分布式鲁棒优化

◦ distortion risk measure 扭曲的风险度量

◦ convex risk measure 凸风险度量

◦ convex envelope 凸包

● 主要内容：

◦ 本文的背景是关于分布鲁棒优化（Distributionally Robust Optimization，DRO）在处理决策优化中的分布不确定性问题的重要范式。在决策者不是风险中性的情况下，DRO中最常用的方案是使用期望效用函数来捕捉风险态度。然而，本文提出了一种替代方案，即使用双重期望效用（dual expected utility）来处理决策者的风险态度。在这种方案中，通过应用畸变函数将物理概率转化为主观概率，从而得到一个被称为畸变期望的结果，该畸变期望能够捕捉决策者的风险态度。与期望效用函数线性地依赖概率不同，在双重方案中，畸变期望通常是概率的非线性函数。

◦ 扭曲期望是一种模拟决策者风险态度的方法。与线性依赖概率的期望效用函数不同，在扭曲期望的方案中，扭曲期望通常是概率的非线性函数。这种非线性性质使得扭曲期望能够更灵活地捕捉决策者的风险态度，包括对极端结果的过度权重或偏好。这个扭曲函数是一个非递减函数，并且满足一些特定的条件。在实践中，常用的扭曲函数包括累积概率理论中的反S形扭曲函数。通过使用扭曲期望来模拟决策者的风险态度，我们可以更准确地在决策优化中反映决策者对不确定性的态度。

◦ 本文强调了基于扭曲期望构建的分布鲁棒优化问题的计算可行性，并且表明在许多情况下，可以通过求解基于某个凸扭曲函数构建的替代分布鲁棒优化问题来解决这个问题，后者通常可以通过凸优化技术来精确或近似地求解。本文的DRDRO框架的可行性是建立在分析的基础上的，该分析表明，当根据基于矩的模糊集绘制的最坏情况分布进行评估时，具有非凸扭曲函数的扭曲期望总是给出与其凸对应物等价的风险评估。此外，本文还提供了一个必要条件，用于判断模糊集合是否满足这种等价性。值得注意的是，本文还提到了对于其他类型的模糊集，如基于距离的模糊集，是否可以获得类似的等价结果，这是一个自然的问题。

◦ 数值实验的结果显示，当决策者在面对分布不确定性时过度关注极端结果时，最优决策会变得更加风险规避，并且随着对极端结果的权重增加，决策者试图对冲的最坏情况分布也会发生变化。数值实验还展示了使用扭曲期望来进行决策时的一些情况。具体来说，数值实验使用了逆S形扭曲函数，并应用于一个具体的案例，该案例涉及到运输成本的不确定性。数值实验中使用的数据来源是根据论文中提供的信息进行的模拟。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/167422.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Django框架之csrf跨站请求

Django框架之csrf跨站请求

目录一、csrf跨站请求伪造详解二、csrf跨域请求伪造【1】正常服务端【2】钓鱼服务端三、csrf校验【介绍】 form表单中进行csrf校验： 【1】form表单如何校验【2】ajax如何校验四、csrf相关装饰器【1】csrf_protect装饰器： 【…

阅读更多...

使用VUE3实现简单颜色盘，吸管组件，useEyeDropper和＜input type=“color“ /＞的使用

使用VUE3实现简单颜色盘，吸管组件，useEyeDropper和＜input type=“color“ /＞的使用

1.使用vueuse中的useEyeDropper来实现滴管的功能和使用input中的type"color"属性来实现颜色盘效果： 图标触发吸管 input触发颜色盘组件代码部分 ：<dropper> ---- vueuse使用 <template><div class"sRGBHexWrap fbc…

阅读更多...

【Python百宝箱】第三维度的魔法：探索Python游戏世界

【Python百宝箱】第三维度的魔法：探索Python游戏世界

Python在游戏开发中的魔力前言游戏开发一直是计算机科学中最引人入胜和具有挑战性的领域之一。随着技术的不断进步，开发者们寻找着更快、更灵活的工具来实现他们的创意。在这个探索的过程中，Python以其简洁、易学和强大的特性成为了游戏开发的热门选…

阅读更多...

C#每天复习一个重要小知识day4：枚举的概念/申明/使用

C#每天复习一个重要小知识day4：枚举的概念/申明/使用

目录 1.枚举的概念： 2.申明枚举和申明枚举变量： 申明枚举语法： 申明枚举变量语法： 1.枚举的概念： 枚举是什么？枚举是一个比较特别的存在，它是一个命名的整形常量的集合，一般用它…

阅读更多...

Flume采集Kafka并把数据sink到OSS

Flume采集Kafka并把数据sink到OSS

安装环境 Java环境, 略 (Flume依赖Java)Flume下载, 略Scala环境, 略 (Kafka依赖Scala)Kafak下载, 略Hadoop下载, 略 (不需要启动, 写OSS依赖) 配置Hadoop 下载JindoSDK(连接OSS依赖), 下载地址Github 解压后配置环境变量 export JINDOSDK_HOME/usr/lib/jindosdk-x.x.x expo…

阅读更多...

AWS CLI和EKSCTL的客户端设置

AWS CLI和EKSCTL的客户端设置

文章目录小结过程安装AWS CLI安装EKSCTL在两个Kubernetes Cluster之间切换参考小结在Linux环境中对AWS CLI和EKSCTL的客户端进行了设置。过程安装AWS CLI 使用以下指令安装： curl "https://awscli.amazonaws.com/awscli-exe-linux-x86_64.zip"…

阅读更多...

Qt实现绘制自定义形状

Qt实现绘制自定义形状

先创建一个继承自QWidget的控件： class MyPainterWidget:public QWidget 重写各种鼠标方法： protected:void paintEvent(QPaintEvent *) override;void mousePressEvent(QMouseEvent *e) override; //按下void mouseMoveEvent(QMouseEvent *e) …

阅读更多...

Xposed hook失败的原因

Xposed hook失败的原因

最近对Xposed的比较感兴趣，于是照着网上的给的例子做了一个Xposed模块，但是在安卓模拟器上死活不生效，最后研究发现了两个问题导致： 1、XposedBridgeAPI-89.jar 需要放到项目的lib目录下，而不是libs目录 2、XposedBr…

阅读更多...

HEVC-SCC rgb file input

HEVC-SCC rgb file input

关键字 csc allocateCSCBuffer（）-> m_apcPicYuvCSC xCheckRDCostIntraCSC():更简单， enum ACTRDTestTypes { ACT_TWO_CLR 0, //two color space ACT_TRAN_CLR 1, //transformed color space ACT_ORG_CL…

阅读更多...

补充：如何提高selenium的运行速度？

补充：如何提高selenium的运行速度？

已经通读该专栏文章的同学，或许对UI自动化测试有了一定的掌握，细心的同学肯定会发现一个问题，当用例量达到一定程度时，对于整体用例的执行速度肯定不会很满意。除了应用多线程运行用例的方式加快速度，有没有其他的方法呢？今天告诉大家，方法是有的！也是本人新学的。即…

阅读更多...

[PyTorch][chapter 66][强化学习-值函数近似]

[PyTorch][chapter 66][强化学习-值函数近似]

前言现实强化学习任务面临的状态空间往往是连续的,无穷多个。这里主要针对这种连续的状态空间处理。后面DQN 也是这种处理思路。目录： 1： 原理 2： 梯度更新 3： target 和预测值 4 流程一原理强化学习最重要的是得到 …

阅读更多...

c++版本opencv计算灰度图像的轮廓点

c++版本opencv计算灰度图像的轮廓点

代码 #include<iostream> #include<opencv.hpp>int main() {std::string imgPath("D:\\prostate_run\\result_US_20230804_141531\\mask\\us\\104.bmp");cv::Mat imgGray cv::imread(imgPath, 0);cv::Mat kernel cv::getStructuringElement(cv::MORPH…

阅读更多...

任意分圆环下的 RLWE：如何产生正确的噪声分布

任意分圆环下的 RLWE：如何产生正确的噪声分布

参考文献： [Con09] Conrad K. The different ideal[J]. Expository papers/Lecture notes. Available at: http://www.math.uconn.edu/∼kconrad/blurbs/gradnumthy/different.pdf, 2009.[LPR10] Lyubashevsky V, Peikert C, Regev O. On ideal lattices and learn…

阅读更多...

thinkphp6生成PDF自动换行

thinkphp6生成PDF自动换行

composer安装 composer require tecnickcom/tcpdf 示例 use TCPDF;public function info($university,$performance,$grade,$major){//获取到当前域名$domain request()->domain();//实例化$pdf new TCPDF(P, mm, A4, true, UTF-8, false);// 设置文档信息$pdf->SetCr…

阅读更多...

Azkaban极简使用文档

Azkaban极简使用文档

登录地址: http://服务器ip:8081/, 用户名密码默认都是azkaban 构建项目流程添加Project 编写工作流文件在本机新建文件夹如test, 创建一个flow20.project 文件, 内容 azkaban-flow-version: 2.0(固定步骤)编写flow文件, 例如一个最基础的实例 test1.flow nodes:- name…

阅读更多...

JAVA序列化和反序列化

JAVA序列化和反序列化

JAVA序列化和反序列化文章目录 JAVA序列化和反序列化序列化什么是序列化？为什么要进行序列化?如何将对线进行序列化具体实现过程完整代码序列化什么是序列化？ 就是将对象转化为字节的过程为什么要进行序列化? 让数据更高效的传输让数据更好的…

阅读更多...

Vue中的$nextTick

Vue中的$nextTick

🌈个人主页：前端青山 🔥系列专栏：Vue篇 🔖人终将被年少不可得之物困其一生依旧青山,本期给大家带来vue篇专栏内容:vue中的$nextTick 目录 🐋Vue中的$nextTick有什么作用？ 🐋一、…

阅读更多...

socket can中是如何根据结构体can_bittiming_const中的字段计算bitrate的？

socket can中是如何根据结构体can_bittiming_const中的字段计算bitrate的？

在 SocketCAN 中，can_bittiming_const 结构体用于表示 CAN 总线的定时参数，包括位率（bitrate）的计算。can_bittiming_const 包含了许多与位率相关的参数，其中一些参数用于计算实际的位率。下面是一些与位率计算相关的…

阅读更多...

小辰的智慧树（差分+前缀和）

小辰的智慧树（差分+前缀和）

登录—专业IT笔试面试备考平台_牛客网 1.考虑总长度之和不能超过m，2考虑限制每棵树高度不能低于ci，如果用二分最短输能截到的高度，还要另外去判断，是否每棵树mid都能严格大于ci ，这样容易超时，换个角度&…

阅读更多...

SQL常见函数整理 _ lead() 向下偏移

SQL常见函数整理 _ lead() 向下偏移

1. 用法是在窗口函数中使用的函数，它用于获取当前行的下一行（后一行）的某个列的值。具体来说，LEAD() 函数可用于查找任何给定行的下一行（后一行）的值，同时也可控制行数偏移量（offse…

阅读更多...

最新文章