返回列表 回复 发帖

数据公司的政治杀伤力:大数据怎么帮特朗普打败了希拉里


有种种迹象暗示,是大数据帮助特朗普团队“干掉”了美国民主党总统候选人希拉里。

在全美几乎所有民意测验机构都栽了跟头的同时,特朗普团队所使用的一家大数据分析公司--剑桥分析(Cambridge Analytica)却如同实施“靶向治疗”一般,帮助特朗普团队精准定位了美国选民的喜好并随后投放广告。该公司还宣称,他们为美国2.2亿成年人都建立了数据点和心理侧写档案。赢得了这样一场大选,特朗普团队付出的不过是1500万美元酬劳。

在Das Magazin等一系列媒体的挖掘下,更多细节在近日浮出水面:特朗普的胜选或许预示着在未来,使用大数据方式进行的政治传播将以使用行为科学、数据分析和精准广告投放的方式彻底颠覆以往的竞选模式,而这一切都要从一位波兰天才开始讲起。

华沙天才和他的大数据模型

2008年,来自波兰华沙的高材生克森斯基(Michal Kosinski)被剑桥大学录取,去剑桥内心理测验学(Psychometrics)中心读博士。

简单而言,心理测量学这门学科侧重于测量人类心理特征,譬如性格。早在上个世纪80年代,心理学家就建立一个基于五项性格指标的经典模型,这一模型被按照首字母简称为OCEAN模型:开放性(对新经验的开放程度),自我意识(有多么完美主义),外向性(如何社交),亲和度(体贴和合作能力)以及和神经质程度(面对压力是否可以承压)。

通过这一模型,可以精确地为一个人建立心理学侧写(profiling),并定量描绘该人性格,进而推断该受调查者的政治倾向。

尽管OCEAN模型十分有效,但在大数据时代到来之前,在进行样本收集时往往面临难题,因为这份调查问卷通常非常复杂,且问的问题有关重要个人隐私,必须得到受访者的合作,这令大规模的建立心理学侧写档案变得很不现实。

不过在有了互联网和脸书网站之后,克森斯基发现他可以通过一个小的应用程序来完美的解决这个问题。

克森斯基和他的一位同学一起写了一个挂在脸书上的应用程序“我的性格”,这一应用令用户可以应答包括OCEAN模型内的大量心理学问题(譬如“我很容易就抓狂”等);基于上述评估,用户们可以收到一个心理侧写档案,在选项中,用户还可以选择与研究人员分享他们的脸书个人资料数据。

在最初,克森斯基仅仅期待能获得一些来自于朋友们反馈,然而没过多长时间,就有数十万的用户使用了这个应用并为克森斯基留下了大量同该用户脸书信息相连的心理测量学数据。

随后,克森斯基的团队开始将该心理侧写档案同该用户的脸书其他信息进行比对,比如喜欢或分享的内容、性别、年龄以及居住住址等。简单而言,上述性格侧写信息加之个人信息,可以足够令科学研究者对相关性进行研究了,譬如喜欢特定化妆品品牌的男性和其性向之间就存在着相关性,而喜欢Lady Gaga的人最有可能是外向的人等等。

到了2012年,在校准模型之后,克森斯基已经可以做到,如果了解一个用户68个“赞”的内容,他就有可能预测该用户的种族(95%准确率),性向(88%准确率),是民主党还是共和党支持者(85%准确率)。

最终在论文中,克森斯基宣称他的模型已经改善到,通过10个“点赞”,他就可以像该用户的工作伙伴一样了解他,70个“点赞”则可以让克森斯基像该用户的朋友一样了解他,而150个点赞则可以令他像该用户的父母一样了解该用户。

不仅是个人数据可以被用于创造心理侧写档案,一个人的心理侧写档案反过来也可以被用于寻找特定的人群:愤怒的内向者,焦急的父母,或者尚未作出最终决定的民主党选民?

克森斯基开始意识到这一模型内在的有害之处,并在他的论文中警示滥用该模型将造成严重的消极后果,不过彼时并没有多少人理解他的深意。

在2014年,一位剑桥大学心理学系助理教授可根(Aleksandr Kogan)开始接触克森斯基,并表示有企业对于克森斯基的方法论很有兴趣,且希望拿到应用“我的性格”的数据库。

克森斯基发现该企业实际上是SCL,其从事的是“选举管理业务”,关注的领域是“影响大选”。克森斯基所不知道的是,为了参加美国2016年大选,SCL在美国设立了一家新公司—剑桥分析。

目前根据英国和德国媒体的调查,SCL所使用的方法论是从可根方面得到的克森斯基的方法。这令克森斯基感到愤怒,并同可根发生了一系列冲突,最终可根移居新加坡并改名,而克森斯基则怒走美国,在斯坦福大学任教。

英国脱欧和特朗普胜选

2015年,与特朗普私交甚好的法拉奇(Nigel Farage)支持的“脱欧”派宣布他们使用了剑桥分析公司来支持他们的脱欧选战。

实际上在后来有不少政治观察者都注意到,在特朗普的选战日程设置方面,确实同右翼脱欧阵营的宣传手段之间有强烈的共同之处,不过当时很少有人注意到他们都雇佣了同样的一家公司。

在得到了包括谷歌内业内巨头加持的希拉里团队方面,当他们在2016年得知特朗普雇佣了剑桥分析作为其数据分析团队后,只是用鼻子吭声冷笑。

2016年9月,剑桥分析负责人尼克斯(Nix)在美国本土的一场峰会上亮相,并以帮助共和党总统候选人克鲁兹(Ted Cruz)参选美国大选为案例,介绍了他们如何使用行为科学、数据分析和精准广告投放三种方式来影响美国大选选情:在2016年5月弃选之前,几乎无人知晓的克鲁兹的支持率从5%升至35%。

据记者查阅,目前仍可以在网上上看到尼克斯此次题为《选举过程中大数据和心理测量学的力量》的演讲录影。

尼克斯指出,还使用基于人口概念的选战传播是“一个非常可笑的想法”——所有的女人因为性别,就应该得到相同的信息?或者所有的非裔美国人因为他们的种族也只能接收到同样的信息。

换而言之,迄今为止大部分竞选经理们还高度依赖于人口统计学,而剑桥分析已经开始使用心理测量技术,即建立基于OCEAN模型的心理侧写档案:譬如两位在人口统计学意义上,同样是23岁~25岁的女性,其心理侧写档案有着迥异不同,高开放性且外向的女性喜欢尝试不同的新鲜食物并同他人分享,然而低开放性且外向的女性则更愿意同她们的亲密朋友们在一起;根据性格侧写档案,可以进行行为学微观聚焦研究,并进一步的推测目标人群的行为变化。

尼克斯在这次演讲中指出,他们目前的模型可以预测美国每一个成年人的性格特质,这基于三项技术:使用OCEAN模型的行为科学,大数据研究以及精准广告投放。

首先,该公司从不同的来源购买个人数据,例如土地登记数据、汽车数据、购物数据、奖金卡以及俱乐部会员资格等等。根据尼克斯的展示,在美国,几乎所有的个人数据都是可以出售的。例如,如果你想知道犹太妇女住在哪里,你就可以轻松购买这些信息,甚至包括电话号码。

随后,剑桥分析将这些数据与共和党的选民名册和在线数据进行汇总比对,并推算出上述人群的心理侧写档案,这些无生命的数字足迹在突然之间,就变成了有恐惧、有需求、有兴趣和有住宅地址的真正的人。

“我们已经分析了美国每个成年人的个性,总共2.2亿人。”尼克斯甚至表示,他们对美国每个成年人平均掌握的数据点在4000~5000个。

这些数据点与OCEAN模型一起,构成了该公司有针对性对不同个体投放不同广告信息的指导方针。譬如,关于禁枪问题,如果受众是保守人群,则可以在广告中使用“从父亲传承到儿子”这样的传统故事,而如果受众个体偏理性,则使用数据讲道理。

尼克斯指出,其根本在于,无差异信息传播早就过时了,选民需要收到精准定制的信息。

“克鲁兹退出了竞选。”尼克斯当时表示,不过在剩下的两位候选人之中还有一位选择了他的公司,至于结果如何,7周之后见分晓。

特朗普的大数据胜选

从精准广告的角度而言,特朗普的劣势变成了优势:他发言前后不一致,前后矛盾的信息,突然间可以变成对不同选民散发出的不同信息。

而数学家凯蒂·奥尼尔在2016年8月就观测到,特朗普的表现,犹如一个完美的投机算法(opportunistic algorithm),在当年奥尼尔还在专著《数学破坏武器:大数据如何增加不平等并威胁民主》中表达了对大数据在政治中滥用的担忧。

在特朗普胜选后,尼克斯透露,“基本上特朗普每条发出的信息都是数据导向性的。”

就在特朗普和希拉里之间进行第三次总统辩论的那一天,特朗普的团队测试了17.5万个不同的广告变体,以便通过脸书找到正确的版本。 消息大部分仅在微观细节上有些许不同(标题、颜色、标题、照片或视频),以便以最佳心理方式瞄准接收者。

基于此种心理侧写大数据分析,特朗普团队只对选民提供他们感兴趣的信息,而剑桥分析则将美国人口细分成32种性格特征,并最终仅仅专注于17个州。就如同在前文中,克森斯基在男性对化妆品喜爱和性向间发现了相关性一样,该公司挖掘到,特朗普的潜在选民偏好在美国制造汽车这一议题。

在数据分析的基础上,特朗普团队决定在将最后几周的精力都集中在密歇根和威斯康星州,并顺利的赢得了大选。剑桥分析的董事会成员斯蒂夫·班农(Steve Bannon)被任命为特朗普的首席策略师及高级顾问。

尼克斯声称,来自瑞士,德国和澳大利亚客户都与他发生了接触。他的公司目前正在欧洲巡回,展示他们在美国的成功,而今年欧盟的三个核心国家法国,荷兰和德国都面临选举。

接下来,又会是谁呢?
返回列表