Chapter 1: The Big (Bayesian) Picture

这是本章最精妙的思想之一。先验和数据之间并没有固定的权重，而是取决于各自的强度。

书中用左扬达和卡维娅的例子说明这一点：

左扬达：预言抛硬币

先验：非常强——预言硬币在物理上不可能
数据：10次全猜对（仅10个数据点）
结论：先验压倒数据 → 认为他只是运气好

卡维娅：识别甜味剂

先验：较弱——味觉灵敏是有可能的
数据：10次全答对（同样10个数据点）
结论：数据与先验一致 → 相信她确实有能力

关键规律是：数据越多，先验的影响越小。如果左扬达猜对了 10,000 次，即便我们强烈反对，也会开始怀疑自己的先验是否正确。这使得贝叶斯框架天然地具备”被数据说服”的能力。

Chapter 2: Bayes’ Rule

情境：看到一篇标题带感叹号的文章，它是假新闻的概率是多少？

已知信息：

第一步：计算归一化常数（全概率公式）

P(A) = P(A|B)·P(B) + P(A|Bᶜ)·P(Bᶜ)
= 0.2667 × 0.4 + 0.0222 × 0.6
= 0.1067 + 0.0133 = 0.12

第二步：代入贝叶斯公式

P(B|A) = P(B) · L(B|A) / P(A) = 0.4 × 0.2667 / 0.12 ≈ 0.889

结论：先验只有 40% 认为是假新闻，但看到感叹号后，后验概率跳升至 88.9%。数据的力量压倒了先验！

下表是”从表格理解贝叶斯”的精髓——把所有概率关系摆在一张联合概率表里：

有了这张表，后验概率就是在”有感叹号”这一行中，假新闻占的比例：0.1067 / 0.12 = 88.9%。这是最直观的理解方式。

在设定先验分布时，初学者很容易犯一个严重错误：将某些参数范围的概率设定为绝对的 0。这在统计学中被称为违反了“克伦威尔法则”（Cromwell’s Rule）。

假设研发团队对一种新药的安全度非常有信心，在定义先验时断言：“该药的严重不良反应率（ADR）绝对不可能超过 $10%$ ”。因此，他们将 $10%$ 以上区间的先验概率设为 0。

如果临床试验中，发生了意外的安全性事件，实际上 $30%$ 的患者出现了严重不良反应。此时，由于先验中 $> 10%$ 区间的概率是 0，无论收集多少真实数据，后验分布计算出的不良反应率也永远不可能超过 $10%$ 。

敏感性分析 (Sensitivity Analysis)：临床报告中，务必对先验分布进行敏感性分析。即测试“如果换用更宽泛或不同的先验，后验结论是否会发生本质改变”。如果结论依然稳健，说明试验数据本身足够强大。

tags	—
aliases