金盛网聚(北京)科技有限公司/专业信息咨询监测解决方案提供商
金盛网聚 WJFabric
  • 首页
  • 我们的服务
  • 我们的资源
  • 新闻速递
  • 服务平台
  • 我们的案例
  • 我们的优势
  • 关于我们
  • 您当前的位置:首页 > 新闻速递

    方法论|数据“障眼法”的破解

    “得到”App / 2017-07-26 09:23:18

      信息科学家杰文•韦斯特(Jevin West)和生物学家卡尔•伯格斯特龙(Carl Bergstrom)在华盛顿大学开设了一门新课,课程的名字叫做“在大数据时代拆穿胡扯”(Calling Bullshit in the Age of Big Data)。韦斯特和伯格斯特龙认为,人们很容易就能识别出口头上的胡扯,毕竟我们已经使用语言数千年了,但数据和图表是19世纪80年代才流行起来的。由于数据呈现出的复杂性和准确性很容易高效地伪装成胡扯的信息,导致人们上当受骗。

      事实上,大数据行业本身也存在着弊端。目前通过互联网应用,对于大量数据的产生与收集成为现实。基于海量数据,人工智能可以通过数据汇集进行学习,因此我们生活的每个角落都可以被数据化。但大数据行业遇到的问题是,拥有数据的和能够处理数据的往往是两个不同人群,可能是两个不同的公司,相互之间不一定有信任。如是,数据将不能得到实时分析,这将导致所得出的结论未必客观公正。有专家推荐了一个新型算法,叫做同态加密,这个新的算法能够在加密的数据上学习到里面的智慧,不一定要看到数据本身,这样的话,数据拥有者和数据处理者能够分开,能够建立信任基础上的合作。

    a.jpg

      此外,伯格斯特龙表示,对于普通用户来讲,想要拆穿数据的胡扯也很简单,需要的是一些常识和思维习惯。两位教授提供了一些建议:首先,看到一则信息时,你可以问自己三个问题:谁告诉我的?他是怎么知道的?他想向我兜售什么?其次,如果一个数据看起来特别好,好的都不那么真实,那很可能就不是真的。尤其是那些和你的个人观点或者经历十分一致的结论,特别值得怀疑。第三,警惕不公正的比较。比如,有人告诉你,观看特朗普就职典礼直播的人数要比看奥巴马就职直播的人数多,那是因为2017年看直播比奥巴马就职那年容易多了。第四,要知道机器也可能有偏见。比如,用来预测个人犯罪行为的计算机模型对少数族裔表现出了偏见,很有可能是因为用来“训练”算法的数据反映了现有的文化偏见。机器和给他们编程的人一样容易犯错,而且不会因为感到内疚而纠正自己的行为。

      大数据处理信息服务商金盛网聚WJFabric认为,对于任何一种新兴资源的开发和利用,都需要一个批判、渐进的过程。单纯的依赖新生事物,彻底的摒弃过往经验都不是明智的处理方法。大数据作为新近科技的代表,预示着新技术风口的出现,但对于大数据的认识、利用仍处于初级阶段,需要在实践中总结其使用规律,打磨实操模式,抱有对待一种新工具的态度,而非评判事物的方式。

      金盛网聚(北京)科技有限公司成立于2012年,是一家数据处理与信息咨询服务商,公司拥有自主核心技术与服务咨询的团队, 公司“WJFbaric-互联网大数据信息监测SaaS平台”目前注册使用客户将近上万个,为企业、政府、学术机构、成功人士等提供在线信息收集、展示、阅读、存储的免费平台,公司远景致力于通过数据+计算形成可视化的人工智能决策平台。

电话:+86 10 61703208    网址:www.wjfabric.com
邮箱:bj_fabric@wjfabric.cn(北京市) / gz_fabric@wjfabric.cn(广州市)
地址:北京昌平区北清路1号院珠江摩尔国际大厦6号楼2-307 / 广州市海珠区新港中路艺影街129号丽影华庭B区3座 1101室

  京公网安备11010502033100号 京ICP备15061632号-2