因果的可操作性理论:从能动者理论到干预主义
因果的可操作性理论:从能动者理论到干预主义
因果的可操作性理论(Manipulability theories of causation)的核心思想是:因果关系是可被有目的地操控的,我们可以通过干预原因来影响结果。这一思想在科学家和统计学家中很受欢迎,尤其在最新的因果模型理论中得到了广泛的应用。本篇推送将简要介绍可操作性理论在哲学中的讨论。(从本篇推送开始,提及的人名均不再音译)
能动者理论
可操作性理论的一个主要版本是 Peter Menzies 和 Huw Price (1993)提出的能动者理论(agency theory),其基本思想是:
一个事件 A 是另一个不同的事件 B 的原因,当且仅当 A 可以被能动者作为引起 B 的发生的有效手段。
基于自由能动者与因果关系间的这种联系,他们也支持因果的概率提高理论(见《概率因果理论(上)》),但他们所认为的概率是“能动者概率”(agency probabilities):它表示在给定条件下,能动者基于自由选择决定按照该条件行动后,某个特定事件的发生概率。这意味着事件概率是从能动者的主观视角评估的。我们可以由此推论出:
A 是 B 的一个原因,当且仅当在 A 通过一个自由行为实现后 B 的发生概率,高于无条件的情况下 B 的发生概率;
同理可得,若两个概率相等,则 A 不是 B 的原因。
一种批评者认为可操控性理论将会导致因果关系的循环式分析,即在行动中发现因果关系,而又用因果关系来解释行动如何引起结果。然而 Menzies 和 Price 声称能动者理论在概念上避免了这种循环:他们认为,我们每个人都从小积累了一系列作为能动者的直接经验,正是在这些直接经验的基础上,我们形成了关于因果性的概念;换言之,我们关于事件间规律性联结的认识是先于因果概念的,二者处于不同的层面。(显然这种理解是休谟式的)
但是,Menzies 和 Price 也发现了他们的理论面临着一个挑战:有些因果关系是不可操控的。例如,没有任何人曾操控过板块运动(除非他是奥特曼),但地震学家仍然声称是板块运动导致了1989年的旧金山大地震,这个结论是如何得出的呢?Menzies 和 Price的解释是,地震学家用模型人工模拟了板块运动,通过对模型进行有目的地操控得出了这样的因果断言。但这引出了一个新的问题:模型如何能够反映其模拟对象的性质?一个模型无论在尺度上还是在精度上都往往与其模拟对象相差甚远,因此我们必须要对二者之间的“相似性”提出理论解释(这种解释显然不能依据我们的直接经验),否则就不能将通过模型得到的因果解释推广到不可操控的对象上。
一些学者认为可以将引入反事实表述作为权宜之计。修改后的表述如下:
A 是 B 的一个原因,当且仅当如果有一个对 A 的适当操作被执行,那么 B 将会发生改变。
修改后的版本并不要求人类实际上能够对原因进行操作,而只要求“如果”人进行这样的操作的话,结果就会被改变。然而,这一改进对于能动者理论并没有什么实质性意义。让我们顺着它的思路想象一下,如果在宇宙大爆炸的时候有人类存在并且能进行操控,那么我们应该怎样设想接下来的结果?事实上,一些情境是原则上不可设想的,更不可能基于我们的直接经验进行评估,这是 Menzies 和 Price 无法解决的问题。
干预主义
能动者理论暴露出的问题表明,可操作性理论必须针对操作行为作出完善的理论阐释,而这也是后来学者关注的重心;其中进行最深入的系统性考察的学者便是 Judea Pearl (2009)(嗯,还是怹),上一篇推送中也很简要地介绍了他在因果模型理论中的干预性思想(所以就不再重复介绍了,如感兴趣请阅读那本著名的书[Pearl 2009])。
在今天的文献中,普遍使用“干预”(intervention)一词来描述对变量的值的操作行为,而这与 James Woodward 所发展出的干预主义理论密切相关。干预主义核心思想的表述与可操作性理论的旧版本有些许差别:
(1) X 是 Y 的一个原因,当且仅当可以通过干预 X 引起 Y 的变化;
(2)干预行为必须满足一些特定条件,例如:干预必须直接作用于 X,除 X 和 Y 以外的其他变量必须保持不变,等等。
由于干预行为涉及到能动者与因果关系、不同因果类型之间的复杂联系,干预主义所需要处理的问题是琐碎且多方面的,接下来将围绕几个重点展开。
循环性问题
鉴于 Menzies 和 Price 基于直接经验的解决方案问题重重,我们不得不重新面对循环性问题。在干预主义的视角下,这个问题的形式变成如下:我们通过干预变量来得出变量间的因果关系,而又用这个因果结论来解释为什么结果变量会随着原因变量改变而变化(即跟随干预行为而发生变化),这是否是一种循环解释?
Woodward 认为,为了解释一个对 X 的干预过程 I,我们并不需要使用有与 X 和 Y 之间因果关系直接相关的信息,而可以采用一些其它的信息或说法,例如“ X 以符合干预条件的方式被改变后,X 和 Y 仍然相关”。这与 Menzies 和 Price 的思路相似,是将关于因果关系的直接表述等效转换为完全基于已知信息的描述,同时不改变表述实际所指称的内容;区别在于,Woodward 的方案只是将干预作为判定因果关系的一个标准,没有借此定义因果关系的基础,因而规避了循环性问题。
复杂因果关系问题
尽管比旧版本先进了一些,干预主义理论对于复杂因果模型仍然是具有局限性的,尤其是针对多种因果关系并存的模型。
上图表示了一种简化的情况,其中 X 除了与 Y 的直接因果关系外,还通过 Z 与 Y 存在间接因果关系。当我们在未知情况下对 X 进行干预时,可能会对 Y 产生多种不同的结果,情况将变得十分复杂;甚至在有些情况下,干预操作可能阻断 X 到 Y 的因果路径,同时完全作用于 X-Z-Y 这条路径。此外,当我们对复杂因果模型进行分析时,干预性理论不能为我们提供任何区分直接因果关系和间接因果关系的方法,也不能帮助我们排除混杂变量。这表明简单的干预性方法无法应用于包含多种因果路径的实际因果模型。
干预主义理论的解释局限性还体现另一层面:在一些情况中,原因是原则上不可操控的。这里的不可操控不是指实践上无法进行干预,而是指因果主张在这类情况中存在缺陷,使得我们无法设想对原因进行干预,并因而无法评估干预的后果。例如在某种动物的物种归属问题上,我们缺乏明确的概念解释如何把一种动物变成另一种动物,以及这将带来什么后果(这听起来就很荒谬),因而无法得出有效的干预性解释。
以上内容均表明现实变量之间的关系是多样且复杂的,仅仅运用干预性方法并不足以作出充分解释。上一节提到,Woodward 仅仅将干预主义视为理解因果关系的一个有用工具,而没有涉及对因果关系本质的定义;尽管这有助于规避循环性问题,但也限制了干预性方法的解释能力,使得我们在运用干预性方法时必须同时结合其它因果理论进行解释。
实际上,干预主义理论经常诉诸于反事实,其与反事实理论也十分相似和亲缘。例如在反事实理论的后期版本中,Lewis 引入了“变化”(alteration)的思想,表示一个潜在的或现实的事件与被考虑的给定事件在发生时间与发生方式上的不同,这就隐含了一种干预性的思想。然而,二者在更深入的层面上是冲突的:干预主义关注实际或假设的干预行为,认为因果关系必须能够通过某种形式的干预进行检验,但反事实理论基于可能世界的比较,其所涉及的是发生于不同可能世界中的事件,而不是同一变量在实际中的不同取值。相比之下,Pearl 的因果模型理论直接应用了干预主义的思想,是干预主义与其它因果理论结合的一个成功典范。
干预行为的范围
能动者理论部分的末尾提到,如果我们在可操作性理论的表述中删去能动者的核心地位,而只强调适当的操作行为,那么可操作性理论就不要求人类实际上能够进行操作行为;而在干预主义版本中,操作行为甚至也不要求必须是由人类作出的。从干预主义的定义上看,哪怕是一个与生物活动完全无关的“自然”事件或过程,只要它以适当的方式触发了因果效应,就可以被视为一种“操作”——科学家通常将对这类过程的观察研究称为“自然实验”。
因此,干预主义实质上是反人类中心主义的,它既不强调操作必须由人类进行,也不强调人类的操作行为必须是出于自由选择,或是一种由特殊的能动者经验参与的事实。这一改进不仅解决了关于人类不可操控的因果关系的问题,甚至还使得干预性性理论对于一个不存在人类的世界也是成立的。不过这也就产生了新的问题,即我们必须对扩展后的干预概念设定限制,防止其因过度泛化而失效。Pearl 就设定了以下四个限制条件:
(1)干预行为必须是 X 的唯一原因;也就是说,干预行为必须完全打断 X 与其先前的原因之间的联系,使得 X 的取值完全由干预决定
(2)干预行为不能经由一个不通过 X 的路径对 Y 产生影响
(3)干预性为自身不应与 Y 同时受到共同原因的影响
(4)在 X 到 Y 的路径上,没有因干预行为而改变的因子应当被排除在考虑范围之外
基于以上原则,我们现在来考虑这个因果断言:
月球的引力引起了潮汐运动。
按照干预主义的理解,我们可以在理论想象中将月球的引力设为一个原因变量,然后观察发现月球对海水引力的变化会导致海水的状态发生变动。但实际上我们会发现这种理解违反了第二个限定条件,因为任何能够改变月球引力的自然过程都会同时对海水的状态产生独立影响。这表明至少在物理学上,不存在能够同时满足四个限制条件的外科手术式的精确干预行为。
此处所反映的不仅仅是概念或逻辑上的矛盾,更涉及到干预行为和物理理论普适性的冲突,后者可以表达为这样一个宇宙学主张:
宇宙在时刻 t 的状态 St将决定宇宙在时刻 t+d 的状态 St+d,并且这一过程严格符合基本物理理论的规范。
干预的概念如何与这一主张相容呢?Pearl 表达了他的担忧:如果我们把因果模型推广到整个宇宙,因果关系就会消失,因为干预的概念被消解了——干预者和被干预者不存在地位差别,也不存在独立于物理过程之上的干预过程。不过,Pearl 所指的是一种强的干预概念,也有另一些学者支持与物理规范相容的较弱概念,例如Alexander Reutlinger(2012)提出:我们可以想象宇宙在时刻 t 的状态被设定为一个值,然后参照物理定律来确定其后来状态(这实质上是将干预过程与物理过程等同起来,只不过我们可以在理论想象中设定多种不同的情况)。这些学者往往也批评 Pearl 所提出的四个限定条件。
但无论如何,我们事实上面临的是一个更为普遍的问题:因果性的概念如何与物理理论相容?这一问题将在下一篇推送《物理学与因果性》中讨论,此处不再展开。
参考资料
Hernan M. & Taubman S. (2008), “Does Obesity Shorten Life? The Importance of Well-defined Interventions to Answer Causal Questions”,International Journal of Obesity, 32 (Supplement 3): S8–14
Menzies P. & Price H. (1993), “Causation as a Secondary Quality”,British Journal for the Philosophy of Science, 44(2): 187–203.
Pearl J. (2009), Causality: Models, Reasoning, and Inference, Cambridge: Cambridge University Press.
Reutlinger A. (2012), “Getting Rid of Interventions”,Studies in the History and Philosophy of Biological and Biomedical Sciences, 43(4): 787–95.
Woodward J. (1997), “Explanation, Invariance, and Intervention”,Philosophy of Science, 64(supplement): S26–S41.
Woodward J. (2003), Making Things Happen: A Theory of Causal Explanation, Oxford: Oxford University Press.
Woodward J. (2003), “Causation with a Human Face”,Price and Corry, 2007: 66–105.
Woodward J. (2023), 'Causation and Manipulability',The Stanford Encyclopedia of Philosophy. URL = https://plato./archives/sum2023/entries/causation-mani/