【期望DP】

【总览】

【期望dp】

  求解达到某一目标的期望花费:因为最终的花费无从知晓(不可能从$\infty$推起),所以期望dp需要倒序求解。

  设$f[i][j]$表示在$(i, j)$这个状态实现目标的期望值(相当于是差距是多少)。

首先$f[n][m] = 0$,在目标状态期望值为0。然后$f = (\sum f' × p) + w $,$f'$为上一状态(距离目标更近的那个,倒序),$p$为从$f$转移到$f'$的概率(则从$f'$转移回$f$的概率也为$p$),w为转移的花费。

最后输出初始位置的$f$即可。

 

特别的,当转移关系不成环时,期望dp可以线性递推。

但当转移关系成环时,期望dp的最终状态相当于一个已知量,而转移关系相当于一个个方程,可以使用【高斯消元】解决。

“高斯消元期望dp的例题”

【概率dp】

  概率dp通常已知初始的状态, 然后求解最终达到目标的概率,所以概率dp需要顺序求解。

  概率dp相对简单,当前状态只需加上所有上一状态乘上转移概率即可:$f = \sum f'_{i} × p_{i}$

【例题】

【hdu3853】Loops

  简单的期望dp题,设$f[i][j]$表示当前位置到达终点的期望体力,则$f[r][c] = 0$。

  已知每个位置不动、向下、向右的概率。设p0为当前状态下停留的概率,p1为向下的概率,p2为向右的概率,那么就从终点开始逆推:

$$f[i][j] = p0 × f[i][j] + p1 × f[i + 1][j] + p2 × f[i][j +1] + 2$$

  dp强调根据已知推未知,发现等号右边$f[i][j]$正是我们要求的,呢么这就可以构成一个方程了。不过没有那么复杂,因为转移关系不是一个环,只要我们将右边的$f[i][j]$移到左边,再将系数除过去,等号右边就都是已知的了。

【CODE】

#include<iostream>
#include<cstdio>
#include<cstdlib>
#include<cstring>
#include<string>
#include<vector>
#include<algorithm>
#include<cmath>
using namespace std;const int R = 1005, C = 1005;
const double eps = 1e-5;
int r, c;
double p[R][C][3];
double f[R][C];int main(){while(scanf("%d%d", &r, &c) != EOF){memset(p, 0, sizeof p);memset(f, 0, sizeof f);for(int i = 1; i <= r; i++)for(int j = 1; j <= c; j++)scanf("%lf%lf%lf", &p[i][j][0], &p[i][j][1], &p[i][j][2]);f[r][c] = 0;for(int i = r; i >= 1; i--)for(int j = c; j >= 1; j--){if(i == r && j == c) continue;if(fabs(1.0 - p[i][j][0]) < eps) continue;f[i][j] = (p[i][j][1] * f[i][j + 1] + p[i][j][2] * f[i + 1][j] + 2.0) / (1.0 - p[i][j][0]);}printf("%.3f\n", f[1][1]);}return 0;
}
View Code

【hdu4405】AeroplaneChess

  又是一道期望dp。读题可知终点落在$n$~ $n + 5$,将它们的f全部置为$0$。

  因为有直接跳转,所以如果当前点有可以直接跳转到的点,那么这次是不用掷骰子的,因为当前期望等于目标点的期望。

  然后考虑掷色子,摇到$1, 2, 3, 4, , 6$的概率都为$\frac{1}{6}$,所以$f[i] = \sum_{x = 1}^{6} f[i + x] × \frac{1}{6} + 1$

  这样倒序dp便可以得到期望值。

【CODE】

#include<iostream>
#include<cstdio>
#include<cstdlib>
#include<cstring>
#include<string>
#include<vector>
#include<algorithm>
#include<cmath>
using namespace std;const int N = 100050;
int go[N];
int n, m;
double f[N];int main(){while(~scanf("%d%d", &n, &m), n + m){memset(go, -1, sizeof go);for(int i = 1; i <= m; i++){int x, y; scanf("%d%d", &x, &y);go[x] = y;}memset(f, 0, sizeof f);for(int i = n - 1; i >= 0; i--){if(go[i] != -1){f[i] = f[go[i]];continue;}f[i] = (f[i + 1] + f[i + 2] + f[i + 3] + f[i + 4] + f[i + 5] + f[i + 6]) / 6 + 1;}printf("%.4f\n", f[0]);}return 0;
}
View Code

 【poj2096】收集错误

  这道题很有意思。设$f[i][j]$为收集到$i$种bug,属于$j$个子系统的期望天数,同样$f[n][s] = 0$

  考虑当前bug:

  •  属于已经收集到的$i$种,也属于已经收集到的$j$个系统,概率为$\frac{i × j}{n × s}$
  •     属于已经收集到的$i$种,属于新的一套系统, 概率为$\frac{i × (s - j)}{n × s}$
  •    属于新的一种,属于已经收集到的$j$个系统,概率为$\frac{(n - i) × j}{n × s}$
  •     属于新的一种,属于新的系统,概率为$\frac{(n - i) × (s - j)}{n × s}$

上面顺推求出的概率,应该是等于逆推的概率的。

其余的就很基础了。

【CODE】

#include<iostream>
#include<cstring>
#include<string>
#include<algorithm>
#include<cstdio>
#include<cstdlib>
#include<cmath>
#include<vector>
using namespace std;const int N = 1005, S = 1005;
double f[N][S];
int n, s;int main(){scanf("%d%d", &n, &s);f[n][s] = 0.0;for(int i = n; i >= 0; i--){for(int j = s; j >= 0; j--){if(n * s - i * j == 0) continue;double c1 = (double)i * ((double)s - (double)j), c2 = ((double)n - (double)i) * (double)j, c3 = ((double)n - (double)i) * ((double)s - (double)j), c4 = (double)n * (double)s, c5 = (double)n * (double)s - (double)i * (double)j;f[i][j] = ((c1 * f[i][j + 1] + c2 * f[i + 1][j] + c3 * f[i + 1][j + 1] + c4) / c5);}}printf("%.4f\n", f[0][0]);return 0;
}
View Code

 【poj3071】FootBall

  终于到概率dp了。设$f[i][j]$表示当前第$i$轮比赛,$j$队获胜的概率,那么他如果想获胜:

  • 首先上一轮比赛他必须获胜。
  • 然后他的对手上一轮必须获胜。
  • 他的对手只能是相邻的。

  判断相邻十分巧妙的使用了二进制:如果把所有队伍的编号都$-1$:

  从$0$开始的自然数(二进制):$0, 1, 10, 11, 100, 101, ......$

  可以发现相邻的数它们的最后一位一定相反。

  进行第一轮比赛后,相当于将相邻俩个节点替换成他们的父节点$(k >> 1)即将最后一位去掉$,此时相邻的点仍然符合规律。

  所以我们判断两队是否能比赛的标准就是:$(j >> (i - 1)) $ ^ $1 == k >> (i - 1)$

【CODE】

#include<iostream>
#include<cstdio>
#include<cstdlib>
#include<cstring>
#include<string>
#include<cmath>
#include<algorithm>
#include<vector>
using namespace std;const int N = 8;
int n;
double f[N][300], p[300][300];int main(){freopen("h.in", "r", stdin);while(scanf("%d", &n), n != -1){memset(p, 0, sizeof p);memset(f, 0, sizeof f);for(int i = 1; i <= (1 << n); i++){f[0][i] = 1;for(int j = 1; j <= (1 << n) ; j++)scanf("%lf", &p[i][j]);}for(int i = 1; i <= n; i++)for(int j = 1; j <= (1 << n); j++)for(int k = 1; k <= (1 << n); k++)if((((j - 1) >> (i - 1)) ^ 1) == ((k - 1) >> (i - 1)))f[i][j] += f[i - 1][k] * f[i - 1][j] * p[j][k];double ans = -1;int ret = 0;for(int i = 1; i <= (1 << n); i++)if(ans < f[n][i]) ans = max(ans, f[n][i]), ret = i;printf("%d\n", ret);}
}
View Code

转载于:https://www.cnblogs.com/CzYoL/p/7220088.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/369918.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

复习HTML CSS(2)

n 项目符号嵌套编号思路 标签的内容&#xff08;文本、项目符号、表格、图片等&#xff09;必须放在最底层标记中。 n 图片标记&#xff08;行内元素&#xff0c;单边标记&#xff09; l 语法&#xff1a;<img 属性 “值”> l 常用属性 Width&#xff1a;图片宽…

Spring MVC:使用基于Java的配置创建一个简单的Controller

这是我博客上与Spring MVC相关的第一篇文章。 开端总是令人兴奋的&#xff0c;因此我将尽量简洁明了。 Spring MVC允许以最方便&#xff0c;直接和快速的方式创建Web应用程序。 开始使用这项技术意味着需要Spring CORE的知识。 在文章中&#xff0c;您将了解有关创建简单的Spri…

中鸣循迹机器人_自动循迹机器人控制系统的设计

马家庆,于兆勤,刘建群,黄惠敬,陈炜楠摘要&#xff1a;循迹机器人是智能机器人领域内非常重要且被广泛研究的一种智能移动装置&#xff0c;国内许多重要的比赛都以循迹机器人为核心进行开展的。本文设计的智能循迹避障机器人的控制系统主要由四个模块组成&#xff1a;最小系统模…

2、创建分类器笔记

创建分类器 简介&#xff1a;分类是指利用数据的特性将其分类成若干类型的过程。分类与回归不同&#xff0c;回归的输出是实数。监督学习分类器就是用带标记的训练数 据建立一个模型&#xff0c;然后对未知的数据进行分类。分类器可以实现分类功能的任意算法&#xff0c;最简单…

天刀现在最新服务器,天涯明月刀8.21服务器更新公告

原标题&#xff1a;天涯明月刀8.21服务器更新公告青龙乱舞区、大地飞鹰区、天命风流区、沧海云帆区、边城浪子区全部服务器将在8月21日6:00~12:00停机维护更新&#xff0c;维护完成后上述各服务器客户端版本更新至2.0.95.5。本次维护主要调整和修改内容如下&#xff0c;给您带来…

复习上学期的HTML CSS(1)

自己跟着网上教程复习上学期的HTML CSS&#xff0c;因为已经忘得差不多了&#xff0c;而且现在学的js也要以HTML CSS为基础&#xff0c;坚持每天持续更新。 n B/S 网络结构 Browser/Server 浏览器/服务器&#xff0c;这是现在最流行的网络模式。如新浪网、凤凰网等。 C/S Clie…

XAML或JavaFx?

这是使用XAML和JavaFx构建应用程序的快速&#xff0c;主观&#xff0c; 无权且非常不科学的比较。 比较是基于我与每个人合作的个人经验。 在XAML方面&#xff0c;这意味着WPF和Win8存储应用程序 。 在JavaFx方面&#xff0c;这意味着Windows 7应用程序。 JavaFX JavaFx被Orac…

java面试2

1、list中去重&#xff08;无序&#xff0c;有序&#xff09; 2、list中记录每个出现次数&#xff0c;并去重 public static void main(String[] args) { List<String> li2 new ArrayList<String>(); li2.add("11"); l…

mongodb修改数据语句_MongoDB 之 手把手教你增删改查 MongoDB - 2

如果没看到我的金玉良言的话,就重新打开一次客户端和服务端吧本章我们来学习一下关于 MongoDB的增删改查一.MongoDB操作 之 原生ORM,根本不存在SQL语句创建数据库:这里和一般的关系型数据库一样,都要先建立一个自己的数据库空间嗯嗯嗯嗯,我感受到了你内心的惊呼,瞅瞅你们这些没…

星战前夜服务器维护时间,EVE星战前夜开测时间在什么时候 什么时候测试

EVE星战前夜什么时候开测&#xff0c;EVE星战前夜的测试时间在什么时候&#xff0c;想要知道EVE星战前夜测试时间的小伙伴一起来看看EVE星战前夜的相关资讯&#xff0c;了解一下游戏的开测时间吧。EVE星战前夜目前仍在开发阶段&#xff0c;目前没有进行大范围的测试&#xff0c…

使用Maven Failsafe和TestNG分别运行单元测试和集成测试

最近&#xff0c;对于我的新宠物项目&#xff0c;我决定我希望在标准mvn测试期间执行一些测试&#xff0c;而仅在不同阶段执行一些其他测试 &#xff0c;我们称其为集成阶段。 我在谷歌上搜索&#xff0c;似乎没有任何工作&#xff0c;因此在努力使安装工作顺利进行之后&#x…

3、预测模型笔记

预测模型 1、简介 预测建模&#xff08;Predictive modeling&#xff09;是一种用来预测系统未来行为的分析技术&#xff0c;它由一群能够识别独立输入变量与反馈目标关联关系的算法构成。根据观测值创建一个数学模型&#xff0c;然后用这个模型去预测未来发生的事情。 预测模型…

lintcode-138-子数组之和

138-子数组之和 给定一个整数数组&#xff0c;找到和为零的子数组。你的代码应该返回满足要求的子数组的起始位置和结束位置 注意事项 There is at least one subarray that its sum equals to zero. 样例 给出 [-3, 1, 2, -3, 4]&#xff0c;返回[0, 2] 或者 [1, 3]. 标签 子数…

自己做的HTML

<html> <body background"http://img1.imgtn.bdimg.com/it/u821335874,2927998559&fm27&gp0.jpg"><h1 style"text-align:center">网站集中地</h1><p><a href"/html/html_links.asp">点击“本页”&…

常见问题_智能切膜机常见问题

hoco.智能切膜机&#xff0c;如果使用了错误方式&#xff0c;会导致操作失误&#xff0c;整理4个常见问题&#xff0c;还有错误示范&#xff0c;请跟随视频去了解&#xff0c;你使用正确了吗?1. 膜切反这个需要留意切割膜的正反&#xff0c;有文字面就是正面&#xff0c;无文字…

金融项目app服务器配置,云在金融的应用

银行传统IT架构&#xff0c;难以适应金融市场的业务变化快、服务差异化、多样化的业务需求。除此以外&#xff0c;银行传统IT架构还面临高成本、效率低等一系列问题&#xff1a;• 海量设备缺乏统一标准&#xff1a;规模大的银行计算节点规模以万计&#xff0c;存储设备数百套&…

弱,弱,最弱,利用专业参考来利用垃圾收集器

何时以及何时不使用Java中的专家引用 弱引用&#xff0c;软引用和幻像引用是危险且强大的。 如果以错误的方式使用它们&#xff0c;则会破坏JVM性能。 但是&#xff0c;如果使用正确的方法&#xff0c;它们可以大大提高性能和程序清晰度。 弱引用和软引用在这三个中更为明显。…

bootstrap的栅格系统和响应式工具

关于bootstrap的响应式布局&#xff0c;昨天看了杨老师的视频教学https://www.bilibili.com/video/av18357039豁然开朗&#xff0c;在这里记录一下 一&#xff1a;meta标签的引用 <meta charset"UTF-8"><meta http-equiv"X-UA-Compatible" conte…

【区块链Go语言实现】Part 1:区块链基本原型

0x00 介绍 区块链&#xff08;Blockchain&#xff09;是21世纪最具革命性的技术之一&#xff0c;目前它仍处于逐渐成熟阶段&#xff0c;且其发展潜力尚未被完全意识到。从本质上讲&#xff0c;区块链只是一种记录的分布式数据库。但它之所以独特&#xff0c;是因为它并不是一个…

Java_基础—FileOutputStream

package com.soar.stream;import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.IOException;public class Demo2_FileOutputStream {/** FileOutputStream 在创建对象的时候&#xff0c;如果没有这个文件会帮我们创建出来* 如果有这个文件…