DP专题-学习笔记：概率/期望 DP

1. 前言
2. 例题
3. 练习题

1. 前言

概率/期望 DP，是一种 DP，用来计算概率或者是期望。

其实我认为这种 DP 就是计算期望的，毕竟概率可以看成代价为 1 的期望。

没有学过期望的读者可以看看这篇文章：

而概率/期望 DP，最关键的就是期望方程。

下面看一道例题。

2. 例题

CF1265E Beautiful Mirrors

以这题为例，详细讲解期望 DP 的一般套路。

为了方便，下面直接认为 \(p_i\) 就是概率。

首先设状态。

期望 DP 设状态：\(f[i]=从 1 到 i 的期望(天数/步数/代价/...)\)。

对于这道题，\(f_i\) 为从第一面镜子到第 \(i\) 面镜子都高兴的期望天数。

期望 DP 的转移：使用 \(f_{i-1},f_i\) 列期望方程。

列期望方程是重点！不能列错！ ~~还有不要解错~~

第 \(i\) 天询问失败，从头开始。
此时概率为 \(1-p_i\)，消耗天数为 \(f_{i-1}+1+f_i\)，于是概率乘代价为 \((1-p_i)(f_{i-1}+1+f_i)\)。
第 \(i\) 天询问成功。
此时概率为 \(p_i\)，消耗天数 \(f_{i-1}+1\)，于是概率乘代价为 \(p_i(f_{i-1}+1)\)。

综上，有 \(f_i=(1-p_i)(f_{i-1}+1+f_i)+p_i(f_{i-1}+1)\)。

然而 \(p_i\) 只是概率，真正代码中还需要除以 100 才行。

除以 100 之后最后解得 \(f_i=\dfrac{100(f_{i-1}+1)}{p_i}\)，线性递推即可，不要忘记逆元。

总结一下期望 DP 的一般套路：

设状态 \(f_i\) 为从 1 到 \(i\) 的期望天数/步数/...
列出关于 \(f_{i-1}\) 和 \(f_i\) 的期望方程。
解方程，然后线性递推。
如果有特别的初值要加上。

几个注意点：

期望方程不要列错，一定要考虑到每一种情况。
~~方程不要解错~~
初值不能漏。

例题的代码：

#include 
using namespace std;

typedef long long LL;
const int MAXN = 2e5 + 10, P = 998244353;
int n, p[MAXN];
LL f[MAXN];

int read()
{
	int sum = 0, fh = 1; char ch = getchar();
	while (ch < '0' || ch > '9') {if (ch == '-') fh = -1; ch = getchar();}
	while (ch >= '0' && ch <= '9') {sum = (sum << 3) + (sum << 1) + (ch ^ 48); ch = getchar();}
	return sum * fh;
}

LL ksm(LL a, LL b)
{
	LL ans = 1 % P;
	for (; b; b >>= 1)
	{
		if (b & 1) ans = ans * a % P;
		a = a * a % P;
	}
	return ans;
}

int main()
{
	n = read();
	for (int i = 1; i <= n; ++i) p[i] = read();
	for (int i = 1; i <= n; ++i) f[i] = 100ll * (f[i - 1] + 1) % P * ksm(p[i], P - 2) % P;
	printf("%lld\n", f[n]);
	return 0;
}

3. 练习题

概率/期望 DP 的练习题请前往。

概率期望DP

DP专题-学习笔记：概率/期望 DP

1. 前言

2. 例题

3. 练习题

相关

【概率论】随机变量

编程自学为什么只有1%的成功概率？

Python中的随机采样和概率分布(一)

转基于概率的矩阵分解原理详解（PMF）

BUAA_概率统计_Chap07_统计量及其分布

题解「TJOI2015」概率论

sha1加密出现概率性错误问题

重修概率期望

学习笔记——概率期望

PRML-1.2.1 概率密度函数 pdf

概率图模型-1.简介

概率图模型-7.团树传播算法

标签