《人人都会说谎》是一本和大数据有关的书,作者赛斯•斯蒂芬斯•大卫德维茨曾经担任谷歌大数据科学家。这本书里提到了一个观点:无论是有意还是无心,每个人都可能说谎,他们可能在接受调研时掩藏自己真实的想法,他们的常识可能是错误的。最典型的例子就是2016年的美国大选民调,在大选前一天,希拉里还领先特朗普好几个百分点,但大选结果却是特朗普反超。
作者解释说,美国人不诚实的回答可能导致特朗普的支持率被少报了至少两个百分点,因为不少特朗普的支持者并不愿意在接受民调时说出自己真实的想法。这些不说出自己支持特朗普的人觉得,主流民意把特朗普包装成一个大嘴巴的笨蛋,自己如果公开对他的支持就可能会被别人嘲笑。社会学中将这种行为称作社会期望偏差(social desirability bias),也就是人们会把自己非主流的想法藏起来,担心因自己的想法跟别人不一样而遭到歧视。类似的例子还有很多,比如有人说喜欢读高深的书,其实更喜欢小道消息;有人声称自己喜欢文艺片,其实还是更愿意看火爆的商业大片。
那大数据是如何发现人们撒谎的呢?可以观察人们在互联网上的行为,那能更好地反映他们的想法倾向。还是拿2016美国大选为例,其实,仅仅对搜索信息做一个梳理就能发现特朗普获胜的苗头。比如说在特朗普逆袭的美国中西部几个州,民调都显示希拉里领先,所以希拉里就放松了对这几个州的竞选投入。但谷歌搜索显示,搜“特朗普、希拉里”的人数多于搜“希拉里、特朗普”的人。显然,如果你倾向于投票给谁就更可能把谁的名字放在前边。
所以,大数据研究能告诉你一个更真实的世界,这是做出正确决策的第一步。试想,如果希拉里团队能够更早认识到美国中部地区对大选相关问题搜索的研究,就可能加强在这些地区的竞选投入,意外落选的情况也就很可能不会发生了。
大数据处理信息服务商金盛网聚WJFabric认为,基于互联网的大数据技术在辨识真伪方面的能力愈加强大,原因在于其对互联网使用者行为的跟踪、收集与分析。无论网民意愿如何,大数据技术在客观上会一直进行全面的“记录”。这样做一方面可以“警示”的方式规范网民行为,另一方面也为深度研究网民习惯提供了条件。因此,大数据的分析结果会更加精准。
金盛网聚(北京)科技有限公司成立于2012年,是一家数据处理与信息咨询服务商,公司拥有自主核心技术与服务咨询的团队, 公司“WJFbaric-互联网大数据信息监测SaaS平台”目前注册使用客户将近上万个,为企业、政府、学术机构、成功人士等提供在线信息收集、展示、阅读、存储的免费平台,公司远景致力于通过数据+计算形成可视化的人工智能决策平台。