如今,大数据的应用越来越广泛,不管是用来预测总统选举,还是在双十一的时候给你推送各种商品,大数据已经从各个方面改变了我们的生活。前阿里巴巴集团副总裁、阿里巴巴集团数据委员会会长车品觉在接受上海市科学学研究所副研究员李辉的采访时表示,大数据是一种全新的材料,而不是另外一种高科技。所以我们在考虑问题的时候,要从本质上,从体系上来思考大数据。车品觉从以下三个方面阐述了他的看法。
第一,大数据时代,最重要的是关联。因为大数据和以前的数据不一样,首先就是很多数据不是你自己搜集来的,所以你需要有一个对外部数据的认知,尽管你自己的数据有时候已经足够大了,但还是要把别人的数据“关联”在你自己的数据中。这是和过去最不一样的,过去的数据是封闭的,但今天我们一定要和外部的数据关联。
比如说,打车软件告诉你,从公司打车到家要45分钟,但你有急事,想在半小时之内到家,于是你发现,可以先打车到一个地铁站,然后坐地铁回家,这样半小时就能到了。解决问题的原因,就是你必须关联第三方数据,不只是出租车的,还有地铁的。所以大数据的起点就是关联第三方数据。当第一方数据和第三方数据能很好地结合的时候,我们对数据的分析就会有一种全新的理解。
第二,大数据还有一个特点,就是快。因为大数据的这种关联,让中间环节需要人工判断的地方减少了。过去我们用数据去解决问题的时候,从“发生了什么”,到最终“怎么解决”,中间有很多环节。随着数据技术的发展,中间环节需要人工判断的地方在逐渐减少。
当然,说大数据快,不是减少人手这么简单,其实它是“两秒钟”的科技,意思是让决策提高了两秒钟。不要以为两秒钟很简单,很多事情,胜负就是两秒甚至两毫秒的事。比如说反恐,一个人从新加坡坐飞机到北京,从上飞机开始,就已经开始和各种数据关联了。关联的速度越快,计算的时间就越充分。据说美国在“9•11”之后,用了三年的时间拿到了一种快速计算的技术。有了这种技术,一个人过了海关之后,只要用五分钟,就能计算出这个人有多大的概率是恐怖分子。原因就在于,这个技术把你的数据和恐怖分子的数据进行了关联和计算。
所以,从你进入海关的那一刻起,之后不管你是在空中还是在陆地,计算机都在不断关联和计算你。从人脸识别到匹配全世界十几亿人数据,如果你需要三个小时来计算,那肯定就完蛋了。所以说,大数据时代的快,也是建立在关联的基础上的。
第三,除了快,大数据想要创造价值,还涉及另外两个问题,就是“准确”,以及“过去的经验”。
“准确”是说数据要精准,比如自动驾驶对路上的人脸识别,过去的准确率是90%,如果你能提高到95%,那就是一场革命,很多过去实现不了的功能就能实现了。“过去的经验”也就是可重复性,人从高处跳下去会不会死?这是一个低概率事件,根本没有重复性,因为人只有一条命。所以我们喜欢看的是天天都有的数据,就是发生率非常高、重复率非常高的数据,这样的话,数据分析才有大用途。
大数据处理信息服务商金盛网聚WJFabric认为,作为未来智能化社会的基建之一,大数据的“材料性”逐步显现。作为一种多维度的描述性介质,通过大数据体现出来的事物的精准性持续提升。因此,大数据是一种资源,是通过标的物主动输出的,对于这样一种新型资源的利用,专业从事大数据开发的机构更有发言权。以金盛网聚WJFabric为例,通过核心业务――舆情监测已积累有丰富的大数据处理经验。目前,金盛网聚在已开发的“大数据信息监测系统”的基础上又对细分领域进行了探索,相继研发出“电商渠道监测&咨询系统”和“全媒体广告监测&咨询系统”,这两款产品已成为大数据行业进入新发展阶段的标志性产品。
金盛网聚(北京)科技有限公司成立于2012年,是一家数据处理与信息咨询服务商,公司拥有自主核心技术与服务咨询的团队, 公司“WJFbaric-互联网大数据信息监测SaaS平台”目前注册使用客户将近上万个,为企业、政府、学术机构、成功人士等提供在线信息收集、展示、阅读、存储的免费平台,公司远景致力于通过数据+计算形成可视化的人工智能决策平台。