Chapter 1: The Big (Bayesian) Picture

这是本章最精妙的思想之一。先验和数据之间并没有固定的权重,而是取决于各自的强度

书中用左扬达和卡维娅的例子说明这一点:

左扬达:预言抛硬币
先验:非常强——预言硬币在物理上不可能
数据:10次全猜对(仅10个数据点)
结论:先验压倒数据 → 认为他只是运气好
卡维娅:识别甜味剂
先验:较弱——味觉灵敏是有可能的
数据:10次全答对(同样10个数据点)
结论:数据与先验一致 → 相信她确实有能力

关键规律是:数据越多,先验的影响越小。如果左扬达猜对了 10,000 次,即便我们强烈反对,也会开始怀疑自己的先验是否正确。这使得贝叶斯框架天然地具备”被数据说服”的能力。

Chapter 2: Bayes’ Rule

二、假新闻例子:完整计算过程

情境:看到一篇标题带感叹号的文章,它是假新闻的概率是多少?

已知信息

  • P(B) = 0.4(假新闻先验),P(Bᶜ) = 0.6(真新闻先验)
  • L(B|A) = P(A|B) = 0.2667(假新闻中有感叹号的比例)
  • L(Bᶜ|A) = P(A|Bᶜ) = 0.0222(真新闻中有感叹号的比例)

第一步:计算归一化常数(全概率公式)

P(A) = P(A|B)·P(B) + P(A|Bᶜ)·P(Bᶜ)
       = 0.2667 × 0.4 + 0.0222 × 0.6
       = 0.1067 + 0.0133 = 0.12

第二步:代入贝叶斯公式

P(B|A) = P(B) · L(B|A) / P(A) = 0.4 × 0.2667 / 0.12 ≈ 0.889

结论:先验只有 40% 认为是假新闻,但看到感叹号后,后验概率跳升至 88.9%。数据的力量压倒了先验!


三、联合概率表:直观理解全概率公式

下表是”从表格理解贝叶斯”的精髓——把所有概率关系摆在一张联合概率表里:

B(假新闻)Bᶜ(真新闻)Total
A(有感叹号)0.10670.01330.12
Aᶜ(无感叹号)0.29330.58670.88
Total0.40.61

有了这张表,后验概率就是在”有感叹号”这一行中,假新闻占的比例:0.1067 / 0.12 = 88.9%。这是最直观的理解方式。