在艾瑞上海峰会上,红杉中国专家合伙人、原阿里巴巴副总裁车品觉曾发表主题演讲,描述了说他对大数据下半场的观点。
首先,车品觉认为,如果说上半场是要主动收集数据,那么下半场就是要怎么进行准确判断,把数据变成行动,现在已经积累了很多的数据,如果再不行动就吃不消了,这就是数据的上半场和下半场的区别。在处理数据的时候,有以下几点要注意。
首先是科技放大了我们的能力,但同时也增加了烦恼,当我们需要更精准的东西的时候就会发现,数据质量非常重要。举个例子,阿里金融和其他数据部门打架打得很厉害,就是因为阿里金融需要的数据质量是非常高的,但其他部门给出的数据经常没有考虑这些,因为他们并不知道阿里金融需要用这些数据,这都是数据治理的问题。
其次,数据量增加的时候,精准度也要提升。因为90%的准确度和95%的准确度就是非常大的分水岭。而且,如果你掌握核心数据的话,其实是不需要那么大的数据量的,因为关键信息已经能体现出来了。
再次,光是数据多还不行,还要看能不能匹配,匹配得上才能称为大数据。比如一家公司有海量数据,但这些海量数据有多少是和你匹配的?如果你有100万的用户数据,有多少占比的数据能覆盖?所以在面对数据的时候你要问两个问题:一是如果给你100万的用户数据,你知道他是男的还是女的吗?二是准确度能达到90%以上吗?如果不能回答这两个问题,那就不是大数据了。
最后,车品觉还提出了未来治理大数据的三个机会:
第一个机会:用大数据解决问题的现状是,问题很清晰,但是数据很离散,这里面有很多创新机会。比如某个公司有数据,那就可以有另一家公司说,你的数据使用权给我5年,这就是数据地产。车品觉说,将来会有很多创新来自数据地产,比如数字创新、算法创新、服务创新;第二个机会就是整理目前这些过于离散的数据。现在看来,这个问题需要一个第三方机构来执行;第三个机会是,把数据进一步标准化。比如说政府数据,它不是没有,而是质量相对较差。再比如阿里巴巴,他们的数据也有大量是重复的,不做标准化也会越来越乱。怎样把这些数据的产能释放出来,这也是一个挑战和机会。
大数据处理信息服务商金盛网聚WJFabric认为,大数据的“资源性”已毋庸置疑,企业对于大数据的重视程度也已提升到了新的高度,但如何在操作层面进行有益的尝试是大数据行业进入新的发展阶段所需解决的问题。一方面,目前开源的数据由于离散性较大,因此在将其整合成价值数据方面尚有潜力可挖;另一方面,对企业已掌握的具有相对规模的数据进行整合利用,这是另一个可探索的方向。简而言之,大数据的企业级服务需要有新的产品来填补空白。
金盛网聚(北京)科技有限公司成立于2012年,是一家数据处理与信息咨询服务商,公司拥有自主核心技术与服务咨询的团队, 公司“WJFbaric-互联网大数据信息监测SaaS平台”目前注册使用客户将近上万个,为企业、政府、学术机构、成功人士等提供在线信息收集、展示、阅读、存储的免费平台,公司远景致力于通过数据+计算形成可视化的人工智能决策平台。