貝葉斯推斷如何更新后驗概率?-商業轉載請聯系作者獲得授權

作者:許鐵-巡洋艦科技
鏈接:
來源:今日熱點
著作權歸作者所有。商業轉載請聯系作者獲得授權,非商業轉載請注明出處。

我們來看一下貝葉斯統計的一個有趣的案例案例:假如你是一個女生,你在你的老公書包里發現了一個別的女人的內褲那么他出軌的概率是多少。

圖:貝爺居然能解決家庭糾紛?

稍微熟悉這個問題的人對會知道做這個題目你要先考察基率,你要把這個問題分解為幾步考慮:

1,你老公在沒有任何概率情況下出軌的概率是多少?如果他是個天生老實巴交的程式員或者風流倜儻的CEO,那么顯然不該一視同仁

2,如果你老公出軌了,那么他有一條內褲的概率是多少,如果他沒出軌,出現這個情況概率有多少?想想一般人即使出軌也不會犯那么傻的錯誤,會不會有沒出軌而出現內褲的狀況?有沒有可能是某個暗戀你老公的人的陷害?

3,根據1和2求解最終問題,這才是擁有大學部數學能力的你該做的分析。

在這里1其實就是先驗概率P(A),而2是條件概率P(B|A),最終得到3后驗概率P(A|B)。這三種即是貝葉斯統計的三要素。

基于條件概率的貝葉斯定律數學方程極為簡單:

A即出軌,B是內褲出現,你得到1,2,就可以根據公式算出根據根據內褲出現判斷出軌的概率。

先驗概率在貝葉斯統計中具有重要意義,首先先驗概率即我們在取得證據之前所指定的概率P(A),這個值通常是根據我們之前的常識,帶有一定的主觀色彩。就像剛剛說的出軌的問題,你的先驗概率代表了你對你男人的信心。

有一個非常有趣的現象是如果我們的先驗概率審定為1或0(即肯定或否定某件事發生),那么無論我們如何增加證據你也依然得到同樣的條件概率(此時P(A)=0或1,P(A|B)=0或1)這告訴我們的第一個經驗就是不要過早的下論斷,下了論斷你的預測也就無法進化了,或者可以稱之為信仰。你如果想讓你的認知進步,就要給各種假設留一點空間。

貝葉斯分析的思路對于由證據的積累來推測一個事物發生的概率具有重大作用,它告訴我們當我們要預測一個事物,我們需要的是首先根據已有的經驗和知識推斷一個先驗概率,然后在新證據不斷積累的情況下調整這個概率。整個通過積累證據來得到一個事件發生概率的過程我們稱為貝葉斯分析。

貝葉斯分析中的三要素在不同的問題中通常側重點,很多時候我們都是在忽略先驗概率的作用,比如描述一個人很書呆子氣讓你判斷他是大學部老師還是銷售員的經典案例(要看先驗大學部老師還是銷售員哪個多啊)。但是有時候我們也不理解條件概率,比如著名的辛普森案,為了證明辛普森有殺妻之罪,檢方說辛普森之前家暴,而辯護律師說,美國有400萬女性被丈夫或男友打過,而其中只有1432人被殺,概率是2800分之一。這其實就是勿用了后驗概率,這里的條件是被殺而且有家暴,而要推測的事件是兇手是男友(事實上概率高達90%),這才是貝葉斯分析的正當用法,而辯護律師卻把完全在混淆條件與要驗證的假設。

圖:辛普森案都可以辱哦

理解貝葉斯分析最好的方法即圖像法,這里的A的面積即先驗,后驗是陰影占籃圈的百分比。

貝葉斯分析可以瞬間理解一些常用的理論,如幸存者偏差,你發現一些沒讀過書的人很有錢,事實上是你發現就已經是幸存者了(對應上圖中小紅圈),而死了的人(紅圈外的大部分面積)你都沒見到啊。還有陰謀論,陰謀論的特點是條件很多很復雜,但是條件一旦成立,結論幾乎成立,你一旦考慮了先驗,這些條件成立本身即很困難,陰謀論不攻自克。

注:圖上紅圈和籃圈的面積,很少我們在開始就知道,這才是應用中的難點。

此處貝葉斯分析的框架也在教我們如何處理特例與一般常識的規律。如果你太注重特例(即完全不看先驗概率)很有可能會誤把噪聲看做信號,而奮不顧身的跳下去。而如果恪守先驗概率,就成為無視變化而墨守成規的人。其實只有貝葉斯流的人生存率會更高,因為他們會重視特例,但也不忘記書本的經驗,根據貝葉斯公式小心調整信心,甚至會主動設計實驗根據信號判斷假設,這就是我們下一步要講的。

0 条回复 A文章作者 M管理員
    暫無討論,說說你的看法吧