在9月24日下午举行的视频分发&融合创新论坛上,北京美摄网络科技有限公司产品总监王轶做了题为《美摄智能视音频解决方案》的主旨演讲。
美摄起源于广电行业的一家知名龙头企业——新奥特集团,长期来一直为各大电视台、电影制作公司、广告公司提供相关服务。自2014年起将其技术下移到移动互联网,服务上百家企业,覆盖的用户终端数量已经过亿。
美摄的客户基础分布图
其相关的服务涉及到了多个领域:包括广电行业,如移动新闻采编、智能机顶盒、电视客户端;通讯运营商,与国内三大通讯运营商均有视音频技术相关的合作;移动互联行业,如短视频与移动直播;其他的还有智能设备、教育行业等等。
随着5G时代的来临,未来还将在新场景应用下,建立起与更多行业的合作。
北京美摄网络科技有限公司产品总监王轶表示,美摄现在所有的方案基本上都是以独立的SDK形式来进行输出的,可以概括为六大组成部分:
1、视频拍摄和编辑模块,主要是满足各类移动视频拍摄和制作需求,能提供高效的移动端短视频解决方案;
2、人脸特效模块,基于人脸关键点检测,实现3D面部贴纸瘦脸、大眼、人脸变形等功能;
3、粒子特效模块,电影级粒子特效方案,结合人脸、手势等实现电影级的逼真特效;
4、VR视频编辑模块,国内独家实现移动端360°VR视频实时编辑处理功能;
5、AI智能视频处理模块,基于深度学习的视频识别、分析技术实现视频分类、背景分割、智能裁剪等功能;
6、特效定制设计,专业电影包装团队,提供相关艺术类的定制化设计工作。
美摄产品的特点和优势
1、实现4K级别实时高清处理,支持4K级别的视频编辑,无需预处理,所有特效随时添加随时预览、顺畅极致的视频制作体验;
2、全流程视音频处理功能,丰富全面的视频处理相关功能,涵盖从拍摄、人脸贴纸、美颜、滤镜到主题、字幕、贴纸、转场、配音、专业剪辑等数十种功能,一站式满足各类相关需求;
3、灵活的技术架构,美摄SDK的核心优势是一套非编级别的视频处理架构,提供了极其简单的接口,同时通过功能相互组合的方式,开发者可以根据实际需求,快速自定义一套全新的玩法;
4、移动芯片组深度优化,独有的CPU+GPU的图形处理方式,并针对ios和Android进行了深度优化,以保证了在优秀的兼容性、稳定性前提下,拥有更快的处理速度及更小的CPU及内存占用;
5、优异的SDK体积,美摄SDK通过大量的优化工作,精简代码、让压缩后的SDK包达到IOS为3.9M,Android约3.2M的体积,如果去除FFmpeg话更可以进一步压缩SDK体积;
6、更完善的服务,美摄SDK不仅仅提供标准的SDK产品以及技术支持服务,同时我们还提供视频特效定制,功能定制开发、以及产品整包开发等服务,满足各类客户的需求。
美摄AI智能视音频剪辑方案即将亮相
王轶在本次大会上提前介绍了即将发布的“AI智能视音频剪辑方案”。
据介绍,这套方案主要以AI识别为基础的一套视频智能剪辑处理框架,只要导入一系列的视频或者图片,通过AI的智能检测,识别内容要素,分析剪辑手法,进行AI智能包装,进而快速形成一段高质量的视频。
其主要具备以下的特点:
1、降低了制作门槛,使得人人都可以制作优质视频;
2、让积累的大量视频内容可以产生更大的价值;
3、快速生产视频,进而降低制作成本。
据介绍,AI智能剪辑方案是一套全平台覆盖的方案,以便满足的各种类型场景用户的需求。因此,包Android智能设备、IOS智能设备、服务器方案、小程序方案、智能硬件、PC设备都能涉及的到。
其应用领域也涵盖了多个方面:
整套AI识别框架拥有非常好的扩展性、不论是当前的生活、旅行类视频还是一些体育、游戏类等视频、都可以通过更精确的定制化形成各具特色的方案、服务各类视频的制作要求。
其整个方案框架基于AI智能检测识别为基础,通过六步完成整个制作功能,包括选择导入、智能粗筛、检测识别、智能剪辑、AI包装、预览输出六个步骤。
选择导入:可进行按需选择素材,进行视频、图片混编,其对于时长、数量、格式均无限制;
智能粗筛:可实现自动去重、去模糊、去低质量、去截图;
AI识别检测:基于剪辑片段汇聚信,处理速度高达5倍速,支持NPU加速;
智能剪辑:具备专业剪辑师思维,可实现智能素材排序、智能匹配转场、智能匹配音乐节奏;
AI包装:支持智能匹配片头片尾、AI视频字幕、智能匹配滤镜;
预览编辑:能完整保留时间线内容,支持二次编辑制作(精编),实时预览效果;
王轶表示这套方案可以完美解决许多视频制作中的痛点,预计今年底会有几款最新的安卓机型使用到这一方案,届时可以让许多用户体验到智能剪辑带来的快感。