价值几百亿美元的美国民调不如赌盘?
价值几百亿美元的美国民调不如赌盘?
随着2024年美国两党完成令人眼花缭乱的一系列政治作秀,总统大选正在进入最后的冲刺阶段。民调作为实时反映候选人当选概率的参考指标,正四年一度地占据各大新闻版面头条。不少人都试图通过民调来证明自己对选举预测的正确性。
但伴随着不断出现的“十月惊奇”,尤其是以色列升级中东战争(包括刺杀真主党领导人、开展南黎地面战等等),无疑刺激了民主党左翼选民和穆斯林选民,使得包括密歇根州在内的关键战场州的关键少数选民,在选举日拒绝投票甚至投票支持特朗普的可能性在逐步增大。
这时有人会质疑既然那么多事件发生了,为什么民调整体还是显示哈里斯领先呢?很多人都在引用之前2016、2020年大选民调数据与最终结果有显著差异这一点来反驳民调的有效性。一些局外人也开始将少数几份甚至一份的民调结果视作一个不变的参考答案,完全无视民调所反映的包括穆斯林对民主党支持率下降40%之类的趋势性变化。
最近有两件事情更是再次让民调再次登上热搜。第一个事情是,全球最大的使用虚拟货币的预测市场PolyMarket上,从十月初开始,押注特朗普胜选的筹码急速增加,这被认为一些聪明资金正在对本次美国总统大选做出真金白银的判断。第二件事是,特朗普转发了博弈公司的选举赌盘数据以证明自己处于优势。由于博彩公司的盘口似乎与当时很多民调所显示的结果相反,这也成为不少人认为欧美民调没有参考价值的证据。
那么民调究竟准不准?民调是否有用?要回答这些问题,我们就要回到八年前,那个让民调挥之不去的梦魇时刻了。
绕不开的“滑铁卢”
2016年和2020年两次总统大选预测的连续失误,是许多人对民调产生“不靠谱”印象的源头。这两次大选中,美国的民调都出现了偏差——2016年的民调普遍预测希拉里有70%到80%的胜算,而2020年虽然预测拜登获胜正确,却高估了他的优势。
这其中,无疑以2016年美国总统大选的结果对民调冲击最大。在八年前那场选战中,不仅特朗普出乎意料获胜,其最终得到的支持率甚至与有些民调预测结果的偏差达到十几个百分点。部分民主党人以无法接受失败的姿态发起“通俄门”调查,试图挽回一些颜面;随后三年里,华盛顿政坛陷入一片混乱。
根据统计,1998年来,在选举前21天内的民调在78%的情况下正确预测了胜负(图中高亮)网络截图
同时,民调行业的从业者们开始深入探讨现实与数据之间的偏差原因。在2020年总统大选中,尽管美国民调机构成功预测了民主党候选人拜登的胜选,在某种程度上挽回声誉,但其预测仍存在显著偏差:93%的民调机构过高估计了拜登的优势。
两次连续失误严重损害了民调行业的公信力,甚至就在2020年大选次日,美国知名政治新闻网站“Politico”在其主要栏目中以醒目字体宣称:“民调产业一团糟,应该被炸掉”。
但是,伴随民调预测失准的是,美国民调产业几乎翻倍增长。全美对民调数据的关注不降反升,各个机构的数据依然充斥着媒体头条。在2022年中期选举中,就有部分民调机构进一步调整预测方向,认为中期选举会出现共和党大胜的“红潮”。但最后,预期中的“红潮”并未出现,共和党只获得众议院多数席位,民主党阵营仍实际控制着参议院。
经过一轮轮的钟摆,自认已经搞清楚美国选举状况的民调产业在2024年摩拳擦掌,想要一雪前耻。更多的吃瓜群众也在等着看民调机构的“乐子”。
当然,以上过于简略的回顾并不能代表民调产业的全部故事。民调的价值远非“被炸掉的一团糟”所能总结的。最好的例子莫过于之前两场共三位候选人(拜登、特朗普、哈里斯)参加的大选辩论中,民调数据成为各方评判辩论胜负的焦点。甚至民主党还依据民调和民众观感,直接通过内部协商方式换掉现任总统拜登,让他不能担任民主党的下一任总统候选人。
如果那些将自己的政治生命甚至是自由下注于本次选举的人都在关注民调,那么外界观察者也更不应该将其忽略,以民调为引子了解美国的“里世界”。
预测越失败民调越发展
从民调产业的历史看,由于有为选举提供参考这个硬性需求,每次上一代预测模型出现大问题的时候,民调产业就会迎来一波发展。
美国民调产业的发展历程始于19世纪20年代,但是早期民调就依赖于单纯的问卷调查回访。改变时代的那一刻发生在1936年,当年为了预测大选结果,《文学文摘》基于向读者和潜在读者邮寄的一千万份问卷,并回收了其中238万份。由于《文学文摘》曾准确预测过过去五次选举的获胜者,所以它在当年的10月31日宣布兰登将以57.08%的得票率(对阵罗斯福)和370张选举人票获胜。但是它忽略了,《文学文摘》的受众多是共和党支持者,这直接导致了预测翻车,1936年,罗斯福赢得了胜利。
而作为竞争对手的乔治·盖洛普的科学民调却仅通过几千份的配额控制调查就准确预测了选举结果。这一事件展示了抽样方法的威力,也为如今我们熟悉的民调奠定了基础。
之后,到了20世纪80年代,民调数据急剧增加。特别是在1984年至2000年之间,民调的数量增加了900%。而在今年大选,美国全国预计将会出现1500份各式民调,令人目不暇接。
虽然我们现在看到,2016至2020年,乃至2020至2024年大选周期的美国民调并不甚准确,但是如果置于更广泛的背景中来看,其实整个民调产业在更长周期中,反复证明了其准确性和存在价值。只是由于我们现在处于美国社会长期积累的多重变化集中爆发的阶段,例如2020年民调产业的原有误差在新冠疫情导的背景下进一步放大,甚至导致短期结果参考价值下降。
从民调机构的角度看来,这样的“失误-调整”周期实际上是不可避免,甚至是正常的。毕竟基于民调来预测大选结果的模型,需要通过真实数据不断校准以获得准确结果。与普通模型只需要基于统计快速迭代就能取得比较好成果不同,而现有的大选数据量对于美国大选这样复杂的系统来说无异于杯水车薪。根据一些计算显示,验证预测模型的高准确度需要约4000年的选举数据积累。这意味着现有民调统计中,天然存在大量的无法通过历史数据校正的部分,只能依赖人的判断。
本文原文来自观察者网