视频分割(抠像)技术是并不是什么新鲜事物,过去一些导演和视频制作者常用该技术对场景的前景与背景进行分离,通过此类手法,能够让视频中一些内容变得更为‘吸睛’。
只不过以往这是一种耗时的人工行为,现今谷歌通过机器学习能力,对成千上万的图像进行了注释,包括头发,眼镜,颈部,皮肤,嘴唇等前景元素的像素精确位置。也就是说,只需要通过简单的触控操作,便可进行背景更换。
为了提高速度,谷歌在网络体系结构上也进行了改进,使用四倍以上的大卷积内核来检测高分辨率RGB输入帧上的对象特征,并将网络中间的信道挤压四倍,将256个信道减少到64个的同时也不会对质量产生影响。
目前该技术已在YouTube上进行了测试,遗憾的是仅对少数YouTube播主进行了开放,同时这些主播还要是YouTube Stories的用户。