来自儿子的挑战促使北卡罗来纳州统计学家弗雷德·赖特分析2016年总统大选前的政治民调到底出了什么问题。他对民调方法的分析显示,不准确的选举预测不是由于害羞的选民或有缺陷的调查,而是由于在多个民调中过度平均。现在赖特(和他的儿子)提出了一个更精确的模型。
民调预测分为两部分:预测本身(这里指克林顿和特朗普支持率的总体差距),以及对该预测的信心(通常用百分比或获胜概率表示)。
民意测验专家通过汇总或平均民意测验得出这些概率。所以在最基本的层面上,民意调查越多,就越精确。但民意调查机构还必须决定他们收集的民意调查数据要追溯到多远。大多数网站都包含大约上个月或更早的民调数据。他们对数据进行平均,然后预测获胜者。
“尽管所有人都在关注选举预测的‘错’在哪里,但几乎没有人关注定量像fivethirtyeight或HuffPost这样的预测网站的表现,”Wright说。“许多网站都对克林顿的胜利充满信心,对此,大众媒体做出了反应,但他们真的错了吗?”为了回答这个问题,我们研究了各州预测的表现,而不是只看摇摆州。”
赖特对预测站点的报告结果进行了逆向工程,梳理出各州的具体数据,并将所有数据放在相同的规模上,然后开发了一个回归模型,在这个模型中,每个州对候选人支持的计算既反映了一个国家因素,也反映了一个州对国家因素的具体偏差。
赖特说:“我们的想法是既能看到州的具体信息,也能看到全国的趋势。”“这样做表明,2016年区分‘好’和‘坏’预测网站的主要因素是,从各州的情况来看,后者过于自信,他们的模型对大选前的最新变化不够敏感。”
莱特的模型还发现,克林顿的总体支持率下降的时间比人们普遍认为的要早。赖特说:“由于我们的模型设计得更加敏感,因此在科米的信之前,对克林顿的支持率出现了晚些时候的大幅下降。”“根据我们的结果,如果我们在选举之前运行我们的模型,特朗普获胜的几率将是47%。
“与此相关的是,我们的数据显示,民意调查对特朗普并没有太大偏见,”赖特继续说。“我们的调查显示,当时的民意调查可能大致正确,但当把它们平均起来以获得共识时,克林顿支持率下降的问题在最后一周被不恰当地抹平了。”
赖特把这项研究的想法和得出的模型归功于他的儿子和合著者亚历克·赖特(Alec Wright)。亚历克是北卡罗来纳大学教堂山分校(University of North Carolina at Chapel Hill)的本科生。“这项工作开始于我儿子的挑战,他在选举后对统计学家发表了一些刻薄的评论。我声称我可以做得更好,于是说服他来研究这个,并提出了一个新的模型。我认为我们的努力是成功的。”这项研究发表在选举的研究.

莱特教授:
你的模型显示了538对美国众议院预测的准确性吗?他这次说对了吗?