短视频“崛起”背后的数据中心存储架构选择

2017-12-26 09:25:50 来源:青海新闻网 作者:编辑 王刚 热度:
过去二十年,从看文字资讯,到后来看图片集锦,再到现在看视频,互联网内容不断更新迭代,信息量变得越来越大、可视性也越来越强。短视频也因此应运而生,并且迅速占据我们工作、生活之余的大部分碎片时间,目前,单独一个短视频平台的日播放量就能高达到100亿次。
 
在短视频业务快速扩张的背后,是各种技术的不断革新包括移动终端性能的提升,移动网络的提速,当然还有后端计算平台的日益强劲和稳健。
 
当我们从看图时代转向视频时代时,数据中心又需要什么样的变革来适应新的业务应用?
 
开展短视频业务前,你需要先了解这些数字
 
每月PB级的数据存在哪?
 
相对于文字和图片,视频的存储需要更大的空间。以国内某短视频平台的对外公开数据来看,其平台注册用户超过5亿,日活跃人数8000万,每天新增的段视频数量1000万,按照1条57s的视频大小6MB左右来算,仅从存储的视频容量来看,平台每月新增的短视频容量都将超过1PB。那我们再算下,按照单块硬盘8T,每台服务器12块硬盘,那么每月仅为了存储这些视频就新增12台服务器。
 
如何面对80%的“冷”却不可舍弃的数据?
 
视频行业,不论是短视频,还是直播,又或是视频网站,他们的数据都有着一个共同的特点——数据的热度不均且变化较快。比如据统计,大部分上传的数据的高热度状态仅能保持1周甚至更短的时间。在数据中心中热数据、温数据和冷数据占总数据量的比例约为5%、15%、80%。冷数据也可以被叫做“低价值度的数据”,因为它们占用着大部分的存储空间,但是通常不会再产生价值(被观看)。
 
但是,从一方面来看短视频从本质上来讲类似QQ空间、微信朋友圈,是一种记录生活的平台,因此平台需要保证保有的数据不会被删除,因此这80%的数据成为“没有价值”但是不能被舍弃的“鸡肋”数据。
 
如何安全且低成本地保存这些低价值度的视频数据?
 
高功耗的存储服务器将带来居高不下的运营成本
 
服务器产品在维护阶段具有周期长、维护成本高的特点,一般而言2年的维护成本就会超过购买成本。所以在设备运行过程中降低耗电量和简化维护成了必须重视的工作。
 
目前国内大部分的存储服务器仍是采用通用服务器的配置,并没有针对温冷数据的存储应用进行优化。因此目前大多数数据中心中的存储系统都处于低负载却高功耗的状态,如何把存储集群的功耗降下来,是把数据中心从成本中心转为利润中心的关键之一。
 
短视频背后的数据中心需要怎样的存储架构
 
计算和存储分离,让专业的机器做专业的事
 
短视频背后的数据中心架构其实并不是特别复杂,从视频采集端到客户端,编解码、用户特征分析由专门的计算节点完成;CDN节点负责热点视频的缓存加速和分发;高密度的存储节点用于存储平台的视频数据。
 
CDN节点,考虑如何让热点数据最快发出
 
由于视频流量大,因此CDN节点所承载的吞吐量较大,因此对于存储容量和扩容的便捷度要求更高。另外由于CDN需要存储的数据热度不一,比如1年前的自拍视频,和最热网红的最新出品的点击率有天壤之别。因此,视频数据需要分级存储,将不同热度数据放在不同的存储介质中,充分发挥部件的利用效率,提升存储能效比。
 
对于CDN服务器的选择,通常会需要计算和存储两类服务器来支撑:计算型主要用于处理分发任务等,CPU采用较高主频即可,对于内存和硬盘容量的要求并不高;存储型则用于在关键节点的数据存储和快速分发,因此要求IT架构中需要大容量的SSD或者高速HDD来应对。
 
在服务器的选择上可以考虑浪潮SA5212M5这种计算存储均衡类服务器,。在存储性能上,SA5212M5搭配12块大容量SATA硬盘,单块容量达到8T,单机可容纳96T的CDN数据,满足CDN集群的庞大数据容量需求。而对于相对热的数据,SA5212M5中可加入的4块2.5寸SSD盘位,将提升系统整体响应速度,经实测,使用SSD固态硬盘后单台服务器的服务能力提升了1倍以上。
 
高密存储节点,考虑如何提升存储能效比
 
作为存储节点的高密度服务器本身不需要太高的计算处理性能,因此可以选择基于Intel Xeon-D处理器家族的SA5224M4机型,搭配单颗D-1521 CPU,借助Xeon-D的SOC特性和低功耗优势,通过大容量8T硬盘的使用,以追求更优的TCO收益。
 
从实际测试数据来看来看,搭载D-1531 CPU的SA5224M4的计算性能已经达到原E5-2620V3 平台服务器的80%左右,但是单CPU的TDP(散热设计功耗)只用45W,相比传统E5 CPU功耗降低35W以上。一般服务器的生命周期为三年,这样算下来,1000台的存储服务器集群就能节省下至少1050万的电费。
 
在短视频的传递链条中,从用户端上传的视频可以直接存入4U36盘位组成的存储集群中,并通过分布在各地的CDN节点传送给用户端观看,这样自然对后端存储服务器的硬盘IO表现有着较高的要求。而目前应用的SA5224M4机型,其36盘位顺序写的总带宽接近4.8GB,顺序读接近6GB,有力支撑了这种硬盘高IO读写的性能需求。此外,借助SA5224M4的板载万兆优势,可构建起10Gb的内部高速互联网络,保障了数据访问和传输所需的网络带宽。
 
更高的机柜部署密度
 
同时,衡量服务器的磁盘密度不仅要看每U空间支持的磁盘数量,更要放在机房供电环境下评估单机柜支持的磁盘密度。基于Intel Xeon-D平台的集成性和低功耗优势,在20A的机柜中,42U的空间内,SA5224M4可部署9-10台,单机柜磁盘部署密度提升25%,即以往双路4U36需要部署5个机柜的磁盘密度,当前4个机柜就能解决。不仅提高了单机柜供电利用效率,更减少了租赁机柜的数量,节省服务器生命周期内的运营成本。
 
短视频无疑是2017年投资的风口,在互联网巨头争相布局的同时,不妨审视一下自己的数据中心:你真的为海量视频资源找到理想的存储选择了吗?

责任编辑:王刚

相关推荐

享乐高清数字 华硕TS mini迷你家用服务器

近年来,随着IT技术的飞速进步,功能全面的数字化终端广泛普及。用户对于数据处理的实时性、交互性以及安全性都有着越来越高的要求,客观上推动了个人数字产品由单一功能转向多元应用,并更加高效地实现各种设备之间的资源共享,打造出内容丰富、功能强大、灵活易用的个人/家庭数字平台。家用服务器的出现,加快了资源整合的过程,有力推进了个性化数字梦想照进现实。为什么普通家庭也需要一台服务器呢?比尔.盖茨曾作此解释:“如果你有多台电脑,那么,要想随时获得文件,无论电脑关闭与否,你可能就会希望有一台能够实现自动存储功能的服务器。这样,你就不需要记住驱动器的名称或者带着文件到处跑了。”与商业应用不同,家用服务器旨在为

新视界 新网络——建设数据中心级电视台网络研讨会在杭州举行

“新视界新网络”--建设数据中心级电视台网络研讨会在杭州召开江苏广电总

云计算论坛综述

10月18日,第十九届国际传输与覆盖展览会(ICTC2011)在西安开幕。次日下午,ICTC2011广电IDC建设与云计算论坛在曲江国际会展中心举行。新一代数据中心建设将走怎样的道路?云计算又将面临怎样的机遇与挑战呢?江苏有线杨宏宇:针对广电IDC建设的思考杨宏宇先生首先介绍了江苏有线数据中心的现状,目前江苏有线的网络主要由两个平面组成,一个是光传送平面(即物理光传输网络,采用波分技术),一个是架设在器上的业务网络平面,业务网络主要由数字电视专网、IP数据网、TDM专网组成。今后,三网融合多业务承载将主要通过IP数据网完成。通过目前已建成的省数据中心,江苏有线已完成并实现了省互联网出口的优化综

TiVo CEO:有线电视应接受OTT

Rogers表示,TiVo现正看到美国有线运营商对其产品的兴趣越来越大。他称为了抵抗订户退订有线电视服务,有线电视行业接受OTT内容非常重要。来自市场研究公司Magnaglobal的一份报告显示,到2016年,无付费电视服务的美国电视家庭可能增加高达900万户,其中约400万户家庭取消他们的服务,而另外的500万户从一开始就决定不订购付费电视。