走过2016,迎来2017,不少人在写行业大趋势。我没那个本事,只能在年初写下自己的一些通用性的观点,准备到今年底的时候再翻出来看看。这是第一篇,说说运营商数据的价值问题。
回顾过去
在运营商的系统里,流转着各种数据,而这些数据,正在变得越来越值钱。
第一,运营商数据的全面性。
运营商拥有的数据,有很多的类型,比如:
1.客户的身份信息,包括用户的姓名、身份证信息、消费能力。
2.交互的流量等。
3.客户的行为信息,包括行动轨迹,出行情况,作息时间,各类APP的使用频次等。
4.客户的附加属性,包括终端的使用和更换情况,对新业务和各种产品体验的偏好等。
除了这些基本信息,还可以基于这些数据进行整合和交叉,形成更多的数据集合和分析能力,比如将终端信息和客户信息放在一起,就能看到:什么样的客户喜欢使用什么样的终端,各种终端用户在通信方面的表现和特点是什么,各类品牌终端的客户忠诚度如何等等。
这些数据的分析和展示,具有非常高的商业价值,技术实现方面的难度也并不大,只需要进行简单的多维建模分析,就能看到结果。而同时拥有这么多类型的数据和信息的,以前除了电信运营商,谁能做到?
第二,运营商数据的准确性。
世人都晓数据好,唯有质量做不高。
在IT不发达的时代,要处理和存储海量用户的海量数据,需要巨大的计算能力才能做到。
在过去,似乎只有金融和电信行业,才可能拥有这么丰富的IT资源。而将数据从生产系统中抽取出来,对这些数据进行结构化清洗、转换、加载,用于数据分析和统计,更是一笔巨大的开销。
对于绝大多数企业来说,能把生产数据处理好,就已经很不容易了,对于数据分析以及数据准确性的问题,即使有心,也是无力。
2003年开始,中国移动建设两级数据仓库体系,在生产系统之外,构建分析专用的经营分析系统。
虽然生产系统里的数据也是完整的,但很多数据只是纪录并不会使用,比如用户入网时登记的身份证信息和地址信息,经常出现错漏。当把数据导入进经营分析系统时候,会对这些"无用"的数据进行稽核和过滤,在入口解决数据质量问题,及时发现,及时修复。
从那个时候起,数据质量问题就一直是IT部门的核心工作,随着技术演进和业务拓展,以及分析主题的演化,数据质量问题也在不断发展。
最初,数据仓库里都是结构化数据,用户的基础数据、账单、话单,以及各种业务的使用记录,都按照统一的格式和标准进行存放和处理。
后来,数据的类型越来越多,很多非结构化的数据也进来了,包括用户的详细投诉记录、浏览的网页信息等等。所以,运营商要不断尝试采用新技术,来解决这些新数据的质量问题。
由于持续关注数据质量问题,又持续投入资源去解决质量问题,因此相对于众多的数据提供者,运营商的数据在准确性方面也是有优势的,这方面的价值,相信从事数据处理工作的人士会有更深的体会。
第三,运营商数据的持续性。
巧妇难为无米之炊,用这句话来描述数据分析工作,是再恰当不过。
如果没有基础数据,再牛的算法和专家也难有用武之地。相对于完整性和准确性,运营商数据的持续性更令人垂涎,因此能支持跨时间段的历史分析,不管当时你有没有想过做分析,那些数据当时产生了,同时也保留了下来。
前几年,每个人都有过这样的经历,走在街上被拦住邀请参与问卷调查活动,填完表格之后给点儿小礼品;再有就是收集整理各种分析报告。许多咨询公司的调查报告,都是这样采集数据的。
这些方式的时效性非常差:数据来自某一个时间点,一旦时间点变了,就必须再次收集类似的信息,甚至要做场景重现,这样做不仅成本高,而且数据的偏差也会比较大。
运营商在这方面拥有得天独厚的优势,可以用"取之不尽用之不竭"来形容:用户随时产生数据,数据随时进行处理,处理结果可以自动化地周期性地展示出来。
也就是说,别人花很大力气搞到的数据,只可以卖一次;而运营商只需要自动采集,数据就随用随取,源源不绝。
运营商的数据产生价值,不仅仅是管道商的先天优势,也在于当年对于数据运营的先知先觉,以及十几年来的不断积累。
展望未来
在大数据越来越被重视,价值越来越大的今天,运营商在数据运营方面的价值空间反而下降了。这并不仅仅是运营商自身的问题,也受到很多其他因素影响。
第一,先发优势逐渐丧失。
运营商在十几年前就启动了数据仓库系统的建设,尝试利用数据提高运营效率,降低运营成本。但在实际运营中,真正利用数据来确定工作目标和指导工作内容,是最近几年才真正火起来。
究其原因,还是运营商的市场环境比较特殊。
电信运营商的市场规模超大,同时份额和实力又严重不均,强者衡强,弱者很难翻身。移动再强大就有被拆分的危险,联通再弱小也不会消失。这样的市场格局,用不用数据分析,都没有实质区别。
曾经我们在一个地区,进行了一个对比试验:A组聘请专业分析公司,结合数据制定精准营销策略,然后去执行;B组采用传统的营销方式,花了A组聘请外部资源等量的钱,作为营销资源投放出去。
事实表明:B组的实施效果优于A组。
这个试验并不能说明数据分析没有价值,但这样的案例体现出,电信运营商的市场竞争还处于比较初级的阶段,这样的环境,导致数据分析工作的价值未能充分体现出来。
所以,这些年来,数据分析与应用更多只是出现在创新评奖的舞台上,实际应用的情况并不好。
运营商对数据价值的利用进展缓慢,但别人却在这方面突飞猛进,前期积累起来的经验和优势逐渐被消弭,被超越。
如今,运营商在这方面可真不敢说是领先者了。
第二,数据价值相对下降。
前面总结出完整性、准确性和连续性,是运营商数据价值的优势所在;但此消彼长,如今这些优势和价值也在削减。
比如,https的普及和推广,让运营商的管道价值大幅降低,这是很多人还没有意识到的问题。运营商不能再合法地获取用户与应用之间的完整通信信息,传输加密后,只有通信的两端(客户和网站)知道做了什么事情,运营商则被屏蔽了。
举个例子,运营商只知道什么时间段用户登录了淘宝,不能再获取用户浏览了哪个商品,下了哪些订单。运营商斥巨资购买建设的DPI(深度包解析)工具和系统,有毫无用武之地的危险。
运营商的数据少了,可是其他家的数据却越来越多。
一方面,以BAT为代表的互联网公司,以终端为代表的入口企业,都在收集自身的数据和通过入口的数据;
另一方面,出现了很多第三方的大数据公司,比如通过给企业搭建大数据平台和应用服务,来获取数据的百分点,通过SDK让APP们主动提供数据的Talking Data。此外,还有从广告咨询等领域做起,收集各方的数据的泰一指尚等等。
相对于运营商,这些公司对数据的追求更积极,意愿更强烈,收集数据的效果也更好。
第三是分析应用拓展有限。
虽然经过了十多年的发展,但运营商对大数据的理解仍然十分有限,数据分析能力不足,大量的工作还要依托外包合作。
这不仅是因为IT技术力量有限,或者对数学算法的掌控能力不足,更多还受限于对业务的理解和场景模型的设计能力。业务部门不懂技术,IT部门对业务理解不足,相互之间沟通不畅,又缺乏技术和业务合一的高手,这些都阻碍了运营商在大数据领域进一步的发展,守着金山挖不出宝藏。
如今,运营商也意识到了这个问题,因此大力倡导自主研发,希望自主掌控核心,着力培养自己的IT人员和技术能力。但运营商目前的技术体系和专业人才,多是基于网络和通信的,对IT的理解有限,要在CT环境里,培养大量真正的IT人才,这谈何容易。
还有一个问题,是信息安全。
直到现在,与大数据相关的法律问题仍存在较大的不确定因素。在开放数据和保护隐私的矛盾中,在合法与守法的边界模糊的情况下,对个人隐私保护更加严苛的欧美国家,势必比中国发展得慢;国企出身的中国运营商,势必比互联网公司规矩得多;如果安全方面出了问题,中国移动承担的压力一定比另外两家更大。
因此,从短期来看,在大数据开放以及数据变现方面,运营商求稳求全的心态,还将持续限制其数据价值的社会化。