1大数据到底有多大?
网络高科技公司通过分析大量用户行为数据,可以精准判断用户的喜好乃至性格。然而在享受高度个性化服务的同时,不知不觉间我们也暴露了大量个人隐私。要便利还是要隐私?这真的是一个问题。
十年前,美国《纽约客》杂志封面文章曾经说,没人知道电脑前面打字的是一条狗;然而如今,就算是一只狗在玩电脑,也会有人知道你在网络上都干了些什么。“嘿,别转头,说的就是你。”哈佛大学的社会学教授加里·金说:“这是一场革命,庞大的数据资源使得各个领域开始了量化进程,无论学术界、商界还是政府,所有领域都将开始这种进程。”我们已经迎来了一个“大数据”时代。
大数据到底有多大?
什么是大数据?羊城晚报记者从维基百科上看到,所谓的“大数据”(big data)指的是:”网络公司日常运营所生成和积累用户网络行为数据增长如此之快,以至于难以使用现有的数据库管理工具来驾驭,困难存在于数据的获取,存储,搜索,共享,分析和可视化等方面。”
由于这些数据量是如此之大,已经不是以我们所熟知的多少G(1G=1千兆,即2的30次方字节)和T(即1千G)为单位来衡量,而是以P(1千T),E(1百万T)或Z(10亿T)为计量单位。
百度对此给予了更形象的描述。光是其新首页导航每天就要从超过1.5PB的数据中进行挖掘,这些数据如果打印出来将超过5千亿张A4纸。全部摞起来超过4万公里高,接近地球同步卫星轨道,平铺可以铺满海南岛。而2020年新增的数字信息成长幅度将是2009年的近45倍。如今,只需两天就能创造出自文明诞生以来到2003年所产生的数据总量。(林曦)
喜怒哀乐皆为商机
事实上,华尔街有炒家利用电脑程序分析全球3.4亿微博账户的留言来判断民众情绪,再以1到50为其打分。同时根据打分的结果,来处理手中数以百万美元的股票。判断原则很简单:如果多数人表现兴奋,那就买入;如果大家的焦虑情绪上升,那就抛售。这一数据分析帮助该炒手今年第一季度获得了7%的收益率。
“有多少人访问你的网站,他们呆了多长时间,这些数据对任何企业来说都至关重要。”京东商城副总裁李曦告诉羊城晚报记者表示,人以类聚物以群分,购物时朋友的选择或推荐比专家观点更为可信,而数据驱动可以为用户提供最接近的匹配结果。“电商搜索引擎可以明显地透露用户的购买意图,这是巨大商机。”
图片来源于羊城晚报
羊城晚报记者了解到,在百度有一个“奇思妙想实验室”,在足够规模的用户数据和技术积累下,输入一句简单的“怎么向女友求婚”,通过“跨领域推荐”引擎技术,便能找到一套为你量身打造的方案。甚至连道具、路线、天气,乃至如何讨得她家小狗欢心的方法都考虑得一应俱全。
2大数据蕴含数百亿金矿
据了解,大数据的市场规模将从2010年的32亿美元成长到2015年的169亿美元,平均年成长率近40%。IBM的CEO罗睿兰说:“数据将是下一个大的自然资源,将会区分每个行业的胜者与输家。”而这些“数据”值钱的地方主要在于时效。IBM一项调查指出,去年58%的企业已经将分析技术用于在市场或行业内创造竞争优势,实现业务价值,同比增加了21%。
淘宝统计,目前来自商家的80%以上数据需求是对消费者购买行为的分析,比如点击量、跨店铺点击,订单流转量甚至旺旺聊天信息的收集和分析等,都成为商家关心的数据。“我们可以得到买家的访问量、固定频率、偏好商品等浅层分析。未来将有更多,不仅能看到商家销量的高低,甚至还可以看出其原因。”天猫副总裁王文彬说。
腾讯网络媒体事业群总裁刘胜义则提出,由于实名制社区及电子商务应用的普及,用户的网络ID和真实身份产生了更多关联。坐拥7亿QQ用户、4亿微博用户、2亿朋友网活跃用户及突破1亿微信用户的腾讯,有海量的数据在平台上产生。如果广告主能将腾讯用户和品牌消费者相联动形成一个营销闭环,那么“大数据”的价值就真正展现出来了。
个人隐私无所遁形?
然而,一些民间机构却担心,企业和机构对这些数据无以复加地利用,可能会侵犯用户隐私。去年国内出现的大规模用户数据泄露,让网民对此也心存疑虑。
“用户隐私是非常敏感的话题,也是使用方法和使用程度的问题。”腾讯OMG广告产品部总经理刘曜告诉羊城晚报记者,如今人和人之间产生的流量大于文件和文件的流量,这就变得很敏感。因为人和人的任何动作都可以认为是隐私,甚至可以粗略地认为,整个互联网都是隐私的。
李曦则认为,用户体验需要个性化的服务,但首先要征求用户授权来采集这些数据,这是最重要的。然而,法律框架的搭建远远赶不上新技术的发展,各国对个人隐私也界定不一,为此Facebook还专门设立了首席隐私官这个职位。
据悉,在美国北卡州有人因雇主看了Facebook上的信息而求职失败,于是求职者对雇主起诉并打赢了官司。为此,北卡州甚至立法规定雇主不得对个人隐私进行网上监控。
美国《连线》杂志创始人凯文·凯利则对羊城晚报记者说:“如果需要个性化服务,就必须用透明度换取。最大化的个性化意味着最大化的透明化。如果不想透露任何信息,那就不能期待别人把自己当作有个性的个体。”