清研智库:如何考量美国大选民调的准确性

特朗普落后了,而且不是一点点。尽管特朗普在民调中落后拜登2年多,但他一直潜伏在误差范围附近或刚好在误差范围之外。由于经济方面的基本数据强劲,而民众对拜登的热情又明显不足,特朗普最终胜出是再合理不过的事情了(更何况有过半数的选民始终认为特朗普会赢)。

然而,过去两周对特朗普来说是糟糕的,数字下沉远超误差范围。

但民调的准确度如何,该如何考量?

首先,民调不能预测。每一次的民调都是选民在进行民调时的想法的快照。只有当一系列民调在一段时间内达成一致时,我们才能进行短期预测,而且只有在当前条件保持不变或变化不大的情况下才能进行预测。选举中不断变化的条件是使预测变得困难的原因,任何人在几个月后选择总统选举的胜利者,都是在进行有根据的猜测,并希望他们的运气能保持。

Real Clear Politics和Five Thirty Eight的平均值很好地近似地反映了竞选的情况。不足之处是,它们包括一些糟糕的民调和长达两周的民调,这使得它们滞后于当前的情况。但如果民调做得不好,看最新的民调就会成为一个问题,而媒体对冲击力而非实质内容的偏爱更加剧了这个问题。媒体往往会把版面给那些数字惊人的民调,而事实上这些 “惊人”的数字往往是民调不好的表现。

想想CNN的民调。其10月4日的民调,让拜登以57%比41%的优势领先,不仅比其他任何民调数月来的差距更大,而且远远超过了平均误差范围。糟糕的民调对CNN来说并非新鲜事。在过去四次民调中,拜登的民调都高于Real Clear Politics的平均水平,有两次民调远远超出了误差范围。当一个结果与其他结果相差甚远时,就被称为 “离群值”,应该以怀疑的态度看待。CNN最近就专门做 “离群 “民调。更有甚者,CNN的 战场州民调将几个州混为一谈,而不是分开来看,使得这些数字毫无价值。我认为,在这次选举中,CNN的民调是所有主要新闻机构中最差的。

另一方面,《投资者商业日报》(IBD)对特朗普过于青睐,其10月1日的民调将特朗普的总统的支持率置于拜登的3个百分点以内。IBD的问题在于,它的抽样调查包括了几乎与民主党人相同数量的共和党人。这是一个异常慷慨的投票率假设,因为民主党人目前的人数远远超过共和党人,而且几十年来在政党认同上普遍领先于共和党。要想让IBD的数字成为事实,必须出现巨大的投票率失衡。

而这正是民调最难解决的问题:猜测投票率组成。谁来投票显然很重要,而且虽然投票人数的组成很少发生显著变化,但仅仅几个百分点的变化可以意味着很多。不幸的是,很少有民调机构会发布完整的交叉表,以确定每个人口统计类别的人数。YouGov做到了,他们提供了透明度,所以读者可以分析他们的方法和结果。所有的民调都应该是不引起怀疑的民意调查

Rassmussen长期以来被认为是一家支持特朗普和共和党的民调公司,在过去的四年里,特朗普的数据一直较好。但Rassmussen只报告 “可能的选民”,而不仅仅是登记选民,这往往有利于特朗普。Rassmussen很可能有一个模型,认为更多的共和党选民会参加。然而,如果没有交叉表,我们无法确定。

最近Rassmussen的民调急转直下,对特朗普不利,从9月22日拜登48%:47%的优势,到10月6日52%:40%的优势。虽然特朗普一直在失势,但这是一个大动作,Rassmussen可能调整了投票模式。如果是这样,要感谢Rassmussen改变其方法论,以反映它如何看待选举的发展。但如果它能公布其抽样构成,那将会有所帮助。

抽样组成不是调查的唯一问题。对于低样本的民调,应该总是非常谨慎地信任。任何受访者少于800人的调查,不论是全国性或者州级的调查,都应该被立即取消。样本太小了,因此有很大的误差。即使是800名受访者的民调也是个问题,因为很难分析组成部分的人口统计数据。

10月1日美国全国广播公司(NBC)/《华尔街日报》(Wall Street Journal)的民调样本量只有800人。其中,19%的人超过65岁(152名受访者)。这是个极小的样本,可能存在较大误差。MSNBC报道称,特朗普在老年人中的支持率急剧下降,35%比62%,支持拜登的比例惊人。但老年人是特朗普最好的人口统计之一,YouGov的最新民调显示,在65岁以上的人口统计中,特朗普以49%对43%的比例领先。当你看到像NBC/WSJ这样的异常结果时,通常意味着民调是一团糟。但NBC宁愿得到瞬间的震惊头条。

最后说说误差范围的奥秘。误差范围很简单。因为调查是大范围人口的一个子集,所以不可能绝对百分之百的准确。当一项民调报告的误差率为4%时,意味着95%的时间里,真实的百分比(如果你对整个人口进行调查)可能会偏离4个百分点。

但是,如果一项调查给出了候选人50%的支持率,误差为4个百分点,并不意味着真实结果同样可能是46%比54%。50%是最好的估计,1个百分点的差距比2个百分点的差距更有可能。完全偏离误差范围的可能性非常小。最近的YouGov的结果是拜登以50%:41%领先,误差率为4.5%。极端情况下,选票可能是45.5比45.5的平局,但这是极不可能的。

最后一点,当候选人A在误差范围内领先候选人B时,他们并不是 “统计上的平局”。候选人A在统计学上是领先的,只是存在一些不确定性。仅仅知道这个事实,你就比电视上几乎所有的专家都要聪明。

本文作者Keith Naughton,原载于《THE HILL》,清研智库李梓涵编译

相关文章