到了语音成为人和机器主要交流工具的时候,一些公司将直接成为大量商业场景背后的真正“数据主宰”。
上个世纪50年代贝尔实验室制造了一台1.8米高的自动数字识别机“Audrey”,它可以识别数字0到9的发音。在此之后的几十年里,语音识别不断被期待成为“下一个十年的杀手级技术”。我本人并不是语音产品的狂热拥趸。唯一想要用说话代替四肢的场景发生在晚上回到家中,瘫倒在沙发上的那一刹那。但是,往往几秒钟过后孩子们就会出现在身边。他们永无止境的问题和大嗓门会成为家庭的背景音,让大多数语音识别的算法失效。
不过,我可能只是少数派,因为《财富》杂志最近一篇报道披露了一个数字:
亚马逊的语音助手每天要与80多个国家的用户进行1.3亿次问答。
这每日上亿次的问答背后是海量的、动态的、真实的人类数据。而类似高质量的数据资产,将直接决定人工智能等领域的公司竞争力。
最近反复听到一些极其近似的表述。本月初,在我们广州的《财富》全球科技论坛上,李开复在视频连线中指出:
中国手机支付海量数据已成为AI发展的燃料。
12月16日晚,我们的微信中引用了IBM大中华区一把手陈黎明的一句话:
公司防火墙后面大数据是人工智能的养料。
这让我们意识到今天的科技大公司只需要动用一点点存量技术能力就可以让用户得到新的体验,继而收割更多的用户数据,在暗中为推出更颠覆性的产品和服务做储备。这种良性循环背后有可能形成一种大而恒强的垄断优势。如果说国家硬实力是经济、科技和军事,那么未来公司的硬实力就是数据和人才。
而某种程度上,“占据数据”的优先度甚至略高于“占据人才”。为什么这么说呢?举个例子,几年前,国内曾经有一次“该不该造超大对撞机”的激烈辩论。这个造价千亿的项目被很多人反对。但是,支持者有一个强大的理由:在这个尖端领域,人才跟着顶级设施走;这种世界级的项目会带来无法想象的高科技人才聚集效应。
而未来拥有海量数据的公司,就像是拥有超级对撞机的国家,他们在人才争夺战中获得天然的优势。尤其当AI技术普及之后,数据的分布或将直接决定人才的分布。事实上,这种人才垄断的趋势已经非常明显。
深度学习三巨头之一的本吉奥指出:
目前人工智能的新特征是人才、财富和权力集中在少数几家公司手中。
本吉奥说的这少数几家公司,我们都能猜到。简单列出他们的名字,想一想,不难发现他们都是海量数据的拥有者。
约书亚·本吉奥,加拿大AI“黑手党”、“深度学习三巨头”之一
在不同的行业,有很多公司的大战略也开始围绕这个逻辑开展。去年底,我们在深圳的国家基因库采访华大基因董事长汪建。他在思考是否可以用互联网游戏模式来运营基因检测——让检测免费,等数据积累到一定程度,针对基因科学衍生出的生命健康服务收费,同时掌握该行业的话事权。
德国的世界级企业卡尔蔡司中国区的CEO曾经对我们提到一个观点:如果把蔡司显微镜头下的各种影像搜集起来,公司将拥有价值大到无法想象的数据财富。
在零售业,7-11一家100平米店面容纳了2900到3000个SKU,收银机会详细记录消费者信息。这家公司掌握的海量商圈信息也许超过任何一家本地商业机构和政府部门。
最后,回看亚马逊,猜测下它为什么不遗余力地发展音箱和语音技术。其实对于他们来说,音箱外表只是一个完美融入场景的产品形态,它真正的价值是一个“语音数据的收割机”。
今年有一条细思恐极的新闻:一个六岁的美国女孩在Alexa的帮助下,独立完成了网购,给自己买了一个170美元的玩具屋。这次“失控”让我们意识到,已经有上亿个设备在我们的身边默默地搜集成年人和孩子的语音数据。到了语音成为人和机器主要交流工具的时候,这些公司将直接成为大量商业场景背后的真正“数据主宰”。
此时此刻,拥有算法和数据分析能力的天才们不得不考虑一个很现实的问题:
你是继续在象牙塔“独守理论的空野”,还是加入这些富有的数据王国,去成为下一个改变世界的人?(财富中文网)