设\(f[i][j]\)表示有\(i\)张红牌,\(j\)张黑牌的期望收益
考虑翻一张牌,有两种情况- 有\(\frac{i}{i+j}\)的概率翻到红牌,此后就只有\(i-1\)张红牌,\(j\)张黑牌
- 有\(\frac{j}{i+j}\)的概率翻到黑牌,此后就只有\(i\)张红牌,\(j-1\)张黑牌
需要注意的是,不要忘了翻开的牌的贡献
翻开一张牌后,该颜色牌数目就少了一张所以有
\(f[i][j]=\frac{i}{i+j}(f[i-1][j]+1)+\frac{j}{i+j}(f[i][j-1]-1)\) 由于是最优策略,所以咱是不可能赔钱的\(f[i][j]=max(0,\frac{i}{i+j}(f[i-1][j]+1)+\frac{j}{i+j}(f[i][j-1]-1))\)初值\(f[0][1]=0,f[1][0]=1\),答案为\(f[R][B]\)
应正向循环本篇博客亦被收进
如有哪里讲得不是很明白或是有错误,欢迎指正
如您喜欢的话不妨点个赞收藏一下吧