当前位置:  开发笔记 > 人工智能 > 正文

排列组合访谈

如何解决《排列组合访谈》经验,为你挑选了2个好方法。

这是一个很好的,因为它是非常直观的:

想象一下,一个装满球的骨灰盒,其中三分之二是一种颜色,三分之一是另一种颜色.一个人从瓮中抽出5个球,发现4个是红色的,1个是白色的.另一个人抽出20个球,发现12个是红色的,8个是白色的.两个人中哪一个应该更有信心,瓮包含三分之二的红球和三分之一的白球,而不是相反?每个人应该承担多少赔率?

我知道正确的答案,但也许我没有得到赔率计算.谁能解释一下?



1> A. Rex..:

Eliezer Yudkowsky 对贝叶斯定理有一个(真的,非常长,但很好)的解释.大约70%的下降,有一段开头"在你面前是一个书包",它解释了这个问题的核心.

最重要的是,重要的是绘制了多少个红色和白色球之间的区别.因此,其他人所说的相反,您不必进行任何计算.(这是合理的假设(a)是用球替换球,或者(b)球有很多球.然后球的数量无关紧要.)这是争论:

回想贝叶斯定理:P(A | B)= P(B | A)*P(A)/ P(B).(关于术语的说明:P(A)是之前和P(A | B)是 B是一些观察你作出的,该术语反映了你的信心.之前之后,你的观察.)定理的这种形式是很好,@ bobince和@Adam Rosenfield正确应用了它.但是,直接使用这种形式会使您容易出现算术错误,并且它并没有真正传达出内心贝叶斯定理.亚当在他的帖子中提到(我在上面提到),重要的是绘制了多少个红色和白色球之间的区别,因为"其他一切都在方程中取消".如何在不做任何计算的情况下看到这一点?

我们可以使用优势比似然比的概念.什么是比值比?那么,我们不会考虑P(A)和P(¬A),而是考虑它们的比率P(A):P(¬A).要么可以从另一个中恢复,但算法比值比更好,因为我们不需要标准化.此外,更容易以其替代形式"获得"贝叶斯定理.

我的意思是我们没有必要规范化,什么是替代形式?好吧,让我们来计算吧.贝叶斯定理说后验概率是

P(A | B):P(¬A| B)=(P(B | A)*P(A)/ P(B)):( P(B |¬A)*P(¬A)/ P (B)).

P(B)是使概率总和为1的归一化因子; 但是,我们正在使用比率,其中2:1和4:2的赔率是相同的,所以P(B)取消.我们留下了一个易于表达的因素:

P(A | B):P(¬A| B)=(P(B | A)*P(A)):( P(B |¬A)*P(¬A))=(P(B | B |π) A):P(B |¬A))*(P(A):P(¬A))

我们已经听说过那里的第二个任期; 这是先前的比值比.什么是P(B | A):P(B |¬A)?这就是所谓的似然比.所以我们最后的表达是

后验赔率=似然比*先验赔率.

我们如何在这种情况下应用它?好吧,假设我们对于urn的内容有一些先验赔率x:y,其中x代表2/3rds红色,y代表2/3rds白色.假设我们画了一个红球.似然比为P(画出红球为2/3rds红色):P(画出红色球为2/3rds白色)=(2/3):( 1/3)= 2:1.所以后验概率为2x:y; 如果我们画了一个白球,后验的赔率是x:2y,类似的推理.现在我们按顺序为每个球做这个; 如果抽签是独立的,那么我们只是乘以所有优势比.所以我们得到的是,如果我们从x:y的比值比开始并绘制r红球和w白球,我们得到的最终比值比为

(x:y)*(2:1)^ r*(1:2)^ w =(x*2 ^ r):( y*2 ^ w)=(x:y)*(2 ^(rw) :1).

所以我们看到重要的是r和w之间的区别.它还可以让我们轻松解决问题.对于第一个问题("谁应该更自信?"),先验赔率无关紧要,只要它们不是1:0或0:1并且两个人都有相同的先验.实际上,如果他们相同的先验是x:y,那么第一个人的后验将是(2 ^ 3*x):y,而第二个人的后验将是(2 ^ 4*x):y,所以第二个人更多当然.

此外,假设先验赔率是均匀的,即1:1.然后第一人的后验将是8:1,而第二人的后验将是16:1.我们可以很容易地将这些转化为8/9和16 /的概率17,确认其他计算.

这里的要点是,如果你得到上面的粗体公式,那么这个问题就很容易了.但同样重要的是,你可以确定你没有弄乱任何算术,因为你必须这么做.

所以这是一个糟糕的编程问题,但它粗体方程的一个很好的测试.只是为了练习,我们将它应用于另外两个问题:

我随机选择两个硬币中的一个,一个公平的硬币或一个假的双头硬币,每个硬币的概率为50%.我把它翻了三次,然后三次都出现了.什么是真正的硬币的概率是多少?

先前的赔率是真实的:假的= 1:1,如问题中所述.我用实际硬币看到三个头的概率是1/8,但假硬币是1,所以似然比是1:8.所以后验几率=先验*似然= 1:8.它是真正硬币的概率是1/9.

这个问题也提出了一个重要的警告:每个可能的观察可能存在不同的似然比.这是因为B的似然比是P(B | A):P(B |¬A),它不一定与¬B的似然比有关,即P(¬B| A):P(¬) C |¬A).不幸的是,在上面的所有例子中,他们互相反复,但在这里,他们不是.

实际上,假设我将硬币翻转一下并得到尾巴.什么是真正的硬币的概率是多少?显然是一个.贝叶斯定理如何检验?嗯,这个观察的似然比是用真实硬币和假硬币看到这个结果的概率,即1/2:0 = 1:0.也就是说,看到单个尾巴会杀死硬币的概率假的,用我们的直觉检查.

这是我在Eliezer页面中提到的问题:

在你面前是一个包含1,000个扑克筹码的书包.我开始时有两个这样的书包,一个包含700个红色和300个蓝色芯片,另一个包含300个红色和700个蓝色.我翻了一个公平的硬币来确定要使用哪个书包,所以你面前的书包是红色书包的先前概率是50%.现在,您随机抽样,在每个芯片后更换.在12个样本中,你得到8个红色和4个蓝色.这主要是红色包的概率是多少?(你不需要准确 - 粗略估计就足够了.)

先验赔率为红色:蓝色= 1:1.似然比为7:3和3:7,因此后验赔率为(7:3)^ 8*(3:7)^ 4 = 7 ^ 4:3 ^ 4.在这一点上,我们只估计7:3,比如2:1,得到2 ^ 4:1 = 16:1.我们的最终答案更大,所以肯定大于95%左右; 正确的答案是96.7%左右.将此与大多数人的答案进行比较,这些答案在70-80%的范围内.

我希望你们同意,从这个角度来看,问题变得非常容易和直观.



2> Adam Rosenfi..:

一个是球的2/3是红色的,然后¬事件一个是球的2/3是白色的事件.设B是第一个观察者看到5个中的4个红球的事件,并且让C成为第二个观察者看到20个中的12个红球的事件.

应用一些简单的组合,我们得到了

P(B | A)=(5选4)(2/3)4(1/3)1 = 80/243

P()=(5选4)(1/3)4(2/3)1 =243分之10

因此,根据贝叶斯定律,观察者1的置信水平为80 /(80 + 10)= 8/9,A为真.

对于第二位观察员:

P(C ^ | )=(20选择12)(2/3)12(1/3)8 = 125970*2 12 /3 20

P(ç)=(20选择12)(1/3)12(2/3)8 = 125970*2 8 /3 20

因此,根据贝叶斯定律,观察者2的置信水平为2 12 /(2 12 + 2 8)= 16/17,A为真.

因此,观察者2具有更高的置信水平,即2/3的球是红色的.关键是要了解贝叶斯法律是如何运作的.事实上,重要的是观察到的红色和白色球的数量不同.其他所有(特别是绘制的球的总数)在方程式中取消.

推荐阅读
贾志军
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有