Chapter 1: The Big (Bayesian) Picture
这是本章最精妙的思想之一。先验和数据之间并没有固定的权重,而是取决于各自的强度。
书中用左扬达和卡维娅的例子说明这一点:
左扬达:预言抛硬币
先验:非常强——预言硬币在物理上不可能
数据:10次全猜对(仅10个数据点)
结论:先验压倒数据 → 认为他只是运气好
数据:10次全猜对(仅10个数据点)
结论:先验压倒数据 → 认为他只是运气好
卡维娅:识别甜味剂
先验:较弱——味觉灵敏是有可能的
数据:10次全答对(同样10个数据点)
结论:数据与先验一致 → 相信她确实有能力
数据:10次全答对(同样10个数据点)
结论:数据与先验一致 → 相信她确实有能力
关键规律是:数据越多,先验的影响越小。如果左扬达猜对了 10,000 次,即便我们强烈反对,也会开始怀疑自己的先验是否正确。这使得贝叶斯框架天然地具备”被数据说服”的能力。
Chapter 2: Bayes’ Rule
二、假新闻例子:完整计算过程
情境:看到一篇标题带感叹号的文章,它是假新闻的概率是多少?
已知信息:
- P(B) = 0.4(假新闻先验),P(Bᶜ) = 0.6(真新闻先验)
- L(B|A) = P(A|B) = 0.2667(假新闻中有感叹号的比例)
- L(Bᶜ|A) = P(A|Bᶜ) = 0.0222(真新闻中有感叹号的比例)
第一步:计算归一化常数(全概率公式)
P(A) = P(A|B)·P(B) + P(A|Bᶜ)·P(Bᶜ)
= 0.2667 × 0.4 + 0.0222 × 0.6
= 0.1067 + 0.0133 = 0.12
= 0.2667 × 0.4 + 0.0222 × 0.6
= 0.1067 + 0.0133 = 0.12
第二步:代入贝叶斯公式
P(B|A) = P(B) · L(B|A) / P(A) = 0.4 × 0.2667 / 0.12 ≈ 0.889
结论:先验只有 40% 认为是假新闻,但看到感叹号后,后验概率跳升至 88.9%。数据的力量压倒了先验!
三、联合概率表:直观理解全概率公式
下表是”从表格理解贝叶斯”的精髓——把所有概率关系摆在一张联合概率表里:
| B(假新闻) | Bᶜ(真新闻) | Total | |
|---|---|---|---|
| A(有感叹号) | 0.1067 | 0.0133 | 0.12 |
| Aᶜ(无感叹号) | 0.2933 | 0.5867 | 0.88 |
| Total | 0.4 | 0.6 | 1 |
有了这张表,后验概率就是在”有感叹号”这一行中,假新闻占的比例:0.1067 / 0.12 = 88.9%。这是最直观的理解方式。