一家是中国智能手机出货量第一,一个是中国互联网社交用户数第一,同在深圳的华为和腾讯这俩家巨头,在今年8月份却为了争夺用户数据而“大打出手”。
孰是孰非,外界并不好给出直接的结论;但透过此事,我们可以发现,产业界围绕着数据的争夺已是刺刀见红。作为企业乃至国家未来最有价值的资产,如何打好大数据这张牌已经成为关键。在这个群体中,既有互联网巨头,也有传统ICT厂商,更多的还是创业型公司。
“大数据时代,最重要的是让每个人做最好的自己。”中国电信北京研究院副总工、云计算与大数据研发事业部总监杨明川在接受C114采访时表示。在他看来,运营商拥有丰富宝贵的大数据资产,但受到各方面原因的限制,并没有充分发挥出应有的价值。“运营商应该摒弃‘数据变现’这种传统思维,而是要综合云计算、大数据与人工智能等技术,形成自主研发的产品与服务能力,进而与行业应用相结合,让运营商的大数据能力迸发出真正的价值。”
运营商的大数据上半场
在很多人看来,运营商的大数据资产非常令人羡慕,但实际的应用情况却不是很乐观。
杨明川认为,运营商的大数据首先是体量大,仅以中国电信为例,其每天可以处理300TB的数据,处理规模已经达到国内领先水准;其次是价值高,具有很强的多维性,网络数据、信令数据、位置数据、业务数据等维度特征多,覆盖范围比较广。
“我们曾经和很多互联网公司进行过探讨,以网上购物的广告价值评估为例,电商平台或者搜素平台自身的数据很难完成端到端的消费行为路径,因为他们的数据只是用户购买行为的一个环节;但运营商不同,用户只要是通过网络,我们就会拥有全流程路径上的大数据。”
但杨明川也清醒的认识到,运营商的大数据有着短板,那就是深度不够。运营商大数据是围绕着个体,单个人自有数据为主要的数据对象,面临着数据隐私和数据孤岛的难题;同时,运营商数据服务通常以标签和报告类为主,无法深入行业嵌入业务流程,发挥数据更大的价值;第三,运营商的数据以结构化数据和半结构化数据为主要处理类型,现在无法处理更高级的非结构化数据,也无法通过深度学习先进技术去挖掘数据背后更深的价值。
另外一个无非避免的问题就是数据平台的分散,运营商尚没有像BAT那样实现完全意义上的数据大集中。不过,中国电信很早就意识到了这个问题,推出了集团统一的大数据平台,中国电信的灯塔大数据研发团队也进行了技术攻关,实现了通过ID关联将不同来源、不同设备上的数据打通。“关键是要解决集团—省分大数据平台的分层构建问题,用分层解耦的方式保持平台的一致性,防止出现数据孤岛。”
体现在产品层面,中国电信目前形成了天翼大数据4+1产品体系,分别是风险管控、精准营销、区域洞察和智慧运营。其中,前两个虽然形成了较大的收入规模,但更多是以标签查询的方式对外提供服务,没有真正深入到行业的核心流程和关键环节;而后两个则是以统计级的数据分析结果来进行服务交付,忽略了个体价值,应用场景受到了限制;在PAAS平台方面,由于数据项目承担周期长,售前工作很复杂,运营商尚没有足够的动力把行业做精做深。
下半场,忘记数据变现
在杨明川看来,运营商要想在大数据的战场上取得胜利,就必须要重新审视过往的战略。
“我个人并不完全认同‘数据变现’的概念,这个理念太倾向于数据本身,大数据未来的成长空间不在于数据变现,而是用数据来解决行业问题。”杨明川说,“运营商之前所推出的大数据产品服务,更多的考虑是数据自身的价值,未来要考虑数据之上的模型构建与价值释放。”
杨明川认为,运营商要想踢好“下半场”的比赛,必须要充分利用好物联网、云计算、人工智能以及自身连接性数据的价值,基于数据的打通找到更丰富的场景,使得数据与能力更深入到客户的业务流程中,让数据/能力和客户内部的数据发生融合。
首先,充分利用运营商数据具有天然的连接性特性,找到各种数据背后的ID对应关系,实现数据打通关联,起到1+1大于2的功效;其次,充分利用物联网所带来的万物互联机遇,拓展数据源的种类和来源,丰富运营商的大数据应用场景;第三是人工智能,利用人工智能技术所带来的能力提升,通过机器学习、深度学习与自然语言处理等技术,让数据释放价值;第四是实现大数据与云计算的结合,把数据嵌入到业务流程,按需提供计算能力和存储能力,可以把人工智能训练的能力用云的方式解决,用云的方式为客户提供服务和数据。
他举了中国电信目前在做的一个畜牧业案例。在这个案例中,中国电信针对肉牛的细分领域,向政府和企业提供不同的服务:面向政府主要是解决精准扶贫、安全溯源和植被保护,面向养殖企业是防畜走失和精细放牧和可追踪。“我们基于物联网、人工智能、大数据打造了一套自主研发的解决方案,同时为政府和牧民根据各自的需求提供了多种技术产品。”
通过这样的创新,政府实现了有效监管和地方品牌塑造,养殖企业可以实现生物资产管理的实时监控,消费者也可以买到产品可溯源的放心保障。基于智能化服务,中国电信把传统的畜牧业实现了信息化基础设施的改造,其创新价值已经走出了畜牧业,还开始与金融行业出现了结合,中国电信所提供的大数据服务,也为金融行业在畜牧业风控方面起到了很好支撑。
运营商不必妄自菲薄
中国电信在肉牛养殖上的成功案例,说明运营商完全可以抛开“数据变现”,有能力做的更好。“与BAT等相比,运营商并不处于劣势,大家基本上是同时到达大数据战场上,关键是看谁掌握更多的数据资源,谁更了解客户,有创新的想象力,持续研发的投入。”
如果有人认为上述案例的成功,还是拜运营商网络能力所赐,那么中国电信北研院最近做的某公安行业客户的案例则更难说明问题。“以前,我们在公安行业所提供的服务,普遍都是宽带、手机、警务通等连接类业务,价值是比较低的。”杨明川说,“而现在,我们为某地公安局所提供的服务则是人工智能与大数据的结合性解决方案,得到了用户的高度认可。”
引入该方案之后,民警再也不用为以往存在的案件信息分散、案件线索甄别困难、能根据经验进行警力部署及核录工作的安排等问题烦恼。该系统融入了更多高可用性人工智能算法模型,其中用于命名实体识别的长短时神经网络模型,准确率能够达到91.6%,用于情感分析的CNN模型,准确率能达到75%,用于警情犯罪数据的预测模型,准确率能够达到92%。
为方便办公,系统还新增了自动撰写、分级发送警情周报的功能,2秒完成5、6个民警一周的工作任务,大大提高了工作效率。有效解决目前中国城市公共治安管理普遍面临的数据体量大、处理效率低、多维警情数据线索发现难度大等问题。
在谈到该系统的后续演进时,杨明川认为,未来将以场景化的智能硬件为能力载体,加强准确度的提升以及分布式计算的适应能力等方面的优化,使用递归神经网络的犯罪预测模型等新算法模型,提高对犯罪规律的把握和预判,“我们的目标就是打造一个AI版的福尔摩斯。”
通过这两个案例,我们可以发现,运营商在大数据领域同样具备竞争力。“我们具备独特的网络大数据资源,这是任何行业外玩家所不具备的;运营商还具备强大的基础资源,以及国有企业所带来的天然身份认同,都是我们的核心竞争力。”杨明川总结说。“大数据的未来在于融合,AI/云计算/物联网等技术要素,必须要有行业应用紧密结合,需求就摆在面前,而我们要做的就是一个难关一个难关的去攻克。”
在杨明川看来,作为运营商的研究机构,北研院的理念就是创新,“我们希望通过技术上的创新,以及与行业应用的结合,为垂直行业做出更大价值,也实现自我的转型与突破。”