人工智能开发者需要物联网数据集市吗?

2017-08-07 10:59:27 来源:司马渡 热度:

如果你对每一篇商业新闻都关注的话,现在你可能满眼看到的都是有关人工智能的文章。人工智能无疑是科技界的热门话题。根据美国创投研究机构CB Insights的数据,在2016年,550多个人工智能相关的初创公司筹集了超过50亿美元的资金。
 
人工智能也是另一个行业——物联网的流行词。人工智能驱动的技术是帮助组织实现其目的的重要工具,对组织更重要的也许是,能根据联网设备中源源不断、而又日益庞大的数据流做出决策。
 
虽然大家将注意力都投入到人工智能上,不过在人工智能核心技术方面仍然存在很多竞争。
 
尽管像百度、脸谱网、谷歌和亚马逊这样的公司正在积极地开发与人工智能相关的软件技术,但是它们正在转变方向,并将其中的许多软件开源。
 
通过上述举措,这些公司及其他公司的意图很明显是要将人工智能作为他们提供服务的基础设施。这些公司的另一个项目(而有些公司可能不是)是人工智能成功的关键:数据。著名的斯坦福大学研究人员Andrew Ng说,“人工智能是开源的……数据的特权访问比算法更重要。”
 
为何要聚焦于数据?
 
机器学习是人工智能的心脏,要依靠数据实现所谓的“?通过实施算法来学习识别模式,并做出预测和决策”。如果没有数据,人工智能最终会变成一个空瓶子,一组算法在里边搅来荡去,而不会产生任何的利益。
 
人工智能算法也需要针对其预期的应用进行适当的数据训练。众所周知,当输入的数据过多,或暴露于交叉目的的数据之下时,人工智能就会运行的磕磕绊绊。
 
物联网数据集市是救星?
 
思科估计,到2020年,联网设备产生的数据将达到600泽字节(相当于6000万亿字节)。这一庞大的数据海洋为开发人员用来训练人工智能系统提供了巨大的潜力。
 
事实上,可以说如果没有人工智能,很多数据将起不到作用,毫无疑问,在能获取这些数据的公司里,负责人工智能开发的人员将利用这些数据工作。
 
但是,不在这样组织内工作的其他人该怎么办呢?因为公司通常认为这种数据是核心资源,不愿在组织之外发布。
 
有一种趋势,可能有助于人工智能研究人员获取物联网数据,至少对于那些有能力为此付费的组织内部人员而言,的确如此。这就是所谓的“数据货币化”或“数据集市”,越来越多的公司正在考虑能否从它们的数据仓库中创造适销对路的产品。
 
根据IDC(国际数据公司)的报告,到2019年,他们预计40%的IT项目会产生货币化数据。随着来自物联网设备的数据量不断增加,我们可以大胆地认为,物联网数据的向前发展将带来大量的数据产品。
 
有迹象表明众多公司正按着这个方向制定计划。在2017年3月的一次活动中,富士通(Fujitsu)讨论了出售物联网数据库的可能性,这表明送货车服务可能对出租车所收集的交通数据有兴趣。德国大陆集团(Continental)和美国德尔福公司(Delphi)这两个汽车系统供应商也表示,它们正在考虑这个市场。
 
首先是营销?
 
当然,如果公司开始向外部客户推销他们的数据,就必须得先有市场。对物联网数据而言,营销/广告市场很可能是第一个这样的市场。
 
多年来,为了不断改进信息定位,市场营销一直在贪婪地消费数据。只要隐私问题能够得到有效的解决,物联网数据就有很大的潜力为营销者提供更有用的、关于消费者的综合数据。
 
在美国,行业关注点已被汽车共享和自动汽车占领。而中国有关物联网数据营销具有潜力的案例关注点在于自行车。中国已经对自行车租赁初创公司表现出很大的兴趣,这些公司通过自行车上的GPS标签和手机应用程序跟踪自行车。
 
摩拜单车是从事这一业务的公司,它发布了一项节日期间客户使用模式的分析报告,提供了以下这类信息:哪些城市的旅游交通有所增加,游客来自哪些城市,以及哪些旅游目的地大受欢迎。
 
这种数据有望对中国旅游企业带来很大的价值,如此它们就可以更好地推销自己的产品。随着联网设备在消费者中不断扩散,营销人员对消费者生活相关的更多综合数据会有更大需求。
 
虽然营销行业掌握很多的消费记录,而且能为更重要的数据进行付费,但它们不是唯一起作用的,相比之下数据仍然具有巨大潜力成为物联网数据市场的第一推动者。物联网数据有可能对许多市场和学科有用。例如,来自交通工具和环境传感器的详细数据无论是对城市规划,还是工业供应链都大有帮助。
 
当然,那些在物联网数据上投资的组织也需要投资于人工智能技术,以获取隐藏在他们所接收的大量数据中的价值。这意味着,来自更多组织的更多数据科学家将能够获得更多的数据来训练他们的算法,这在以往是不能想象的。

责任编辑:朱虹瑾