「BIGO」蔡明卫:AI内容智能鉴审 多场景一体化应用

亚太内容分发大会暨CDN峰会一直致力于推动CDN产业深度融合发展和市场普及,现已成为亚太地区影响力最大的内容分发网络盛会。十年来,在以阿里云、网宿科技、腾讯云等亚太CDN产业联盟成员孜孜不辍的努力下,CDN产业已经成为基础性设施网络,以坚定的基石之姿,支撑起中国成为世界最大的互联网市场。

随着全球数字化、“一带一路”战略的推进,亚太内容分大会暨CDN峰会的影响力正在逐渐向全球延伸,同时也将中国智造CDN及产业链推广向全球每一个角落。

在6月10日下午举办的【运营商论坛】上,BIGO资深产品专家,Aestron AI产品负责人发表了题为《AI内容智能鉴审 多场景一体化应用》的精彩演讲。

「BIGO」蔡明卫:AI内容智能鉴审 多场景一体化应用-DVBCN

关于BIGO

为了让听众对BIGO有更加清晰的认知,蔡明卫在开场首先介绍了BIGO的发展历程。BIGO成立于2014年,是一家高速发展的科技公司,基于强大的实时音视频技术、人工智能技术、CDN技术,推出了一系列音视频类社交及内容产品。包括 Bigo Live、Likee、imo、Hello 语音等。目前BIGO已经服务超过150个国家和地区,积累月活用户近四亿,在全球范围内拥有谷歌、腾讯云、华为、小米等诸多合作伙伴。

BIGO不局限于自身的成功,也希望帮助更多的出海企业获得成功。基于这样的理念,BIGO推出了企业服务,用多年积累的技术底蕴和经验,帮助企业构建共赢新生态。蔡明卫就BIGO企业服务的产品矩阵进行了展示。

「BIGO」蔡明卫:AI内容智能鉴审 多场景一体化应用-DVBCN 「BIGO」蔡明卫:AI内容智能鉴审 多场景一体化应用-DVBCN

一站式内容智能鉴审方案

蔡明卫表示,本次演讲的主题是AI领域的内容安全。BIGO拥有自主人工智能实验室,研究目前AI的前沿技术。在计算机视觉方面,BIGO利用人脸检测、属性识别技术,判断用户的性别、年龄,在识别人的基础上,再进行精准的标签化,对问题或场景进行“精准打击”。可以有效的识别多种风险场景,例如国内当前关注的未成年人沉迷网络问题、欧美关注的恋童癖等问题。BIGO基于全球化强大的数据壁垒,能够覆盖各种不同肤色及人种。

在语音技术方面,通过端到端的语音识别技术,仅用一个模型就可以实现音频到文字的转化。BIGO还提供全球多语种的语音识别技术,结合自然语言处理和运营多年的敏感词积累,能够快速地对语音中的违规内容进行识别。目前主要应用于泛娱乐、游戏电商、教育、云游戏等场景,对应的具体场景有短视频、直播、聊天室等,其中大量的内容都需要进行合规性的把控。BIGO的上述技术帮助客户业务取得了不错的成绩。

「BIGO」蔡明卫:AI内容智能鉴审 多场景一体化应用-DVBCN

大多数一般用户关注的是正常内容,而内容安全关注的是对生态影响很大的内容,如色情、管制器具等。蔡明卫表示,BIGO的图像检索识别,对刀具、枪等大型武器,还有二维码、广告等能够进行有效识别。二维码和广告属于对端内的导流,会对已有的比较成熟的产品造成不良影响。

BIGO的图像易反感识别,针对血腥、暴恐和畸形内容,以及涉及到敏感标识物、领导人、宗教人物、社会事件、敏感意图(如争议区域的划分归属)等内容,同样能进行有效识别。如果不能进行有效把控,会严重影响舆论走势。敏感事件的识别,有些场景还会用到OCR技术,一些特殊情况如图片不违规但图中文字内容违规,涉及个人信息的视频字幕等,需要提取相应的文字内容进行违规性的过滤。

除上述图像识别技术外,BIGO还拥有音频识别技术,ASR支持全球多个主流语种,对语音聊天室的复杂语音环境能够进行有效、精准的识别。此外,娇喘、骚扰、辱骂识别,能够对比较敏感的话语进行识别。目前,从BIGO客户的业务反馈来看,识别模型无论在国内还是国外都取得了优良的效果,能够精准的识别场景,标记并做精准打击。

文字识别领域,BIGO在全球范围内积累了业内领先的全球敏感词库,涵盖全球主流语种、小语种的敏感内容。对于某些单个词汇不构成违规但具体语境违规的,可以通过自然语言理解模型,识别对应违规内容。

内容智能鉴审产品优势

「BIGO」蔡明卫:AI内容智能鉴审 多场景一体化应用-DVBCN

蔡明卫总结说,BIGO提供的整体方案包括四大类:图片、视频、语音、文字。

其中图片、视频能够识别多种场景,还能够对图片、视频的画面内容、文字内容进行识别。语音方面还可以对视频语音进行识别,也可以对纯音频的特定场景识别,像娇喘、干扰音等。对应文字语意的违规可以先通过技术把音频转化成文字,再过敏感词库、NLP模型,有效识别违规内容。

在最近的一次对标测试中,相同推送情况下,BIGO模型比对方多出近两倍的召回。

这首先归功于BIGO强大的技术保障,超过一千二百名的技术人员的努力。全链路发展多模型路线,能够对多种场景和内容做多标签管理。BIGO还拥有全球化的运营团队,根据舆情最新的内容采集风险样本,快速融入算法优化流程,对于比较敏感的数据,运营团队将实时通知各团队对样本进行调整,迅速自动化完成模型更新迭代,拦截对应的风险内容。

在数据保障上,为了保障数据的准确性,BIGO从2017年开始就搭建了全球本地化标注团队,特别针对海外小语种的标注。对于高难度的任务,标注准确度亦超99%,以保障高质量的机器学习能力。

BIGO在同类竞品中一直处于领先地位,蔡明卫也在演讲最后表达了BIGO在技术方面的强大信心和强烈的合作意愿,希望与更多伙伴合作,连接美好世界,传递快乐生活!

相关文章
Canalys:预计今年5G智能手机出货占比将达65%,AI手机渗透率达17%
Canalys:预计今年5G智能手机出货占比将…
阿里巴巴9月份季度业绩:优酷运营亏损逐步减少,云智能集团收入为296.10亿元
阿里巴巴9月份季度业绩:优酷运营亏损逐…
权威报告:大模型深度赋能传媒行业,媒体融合也走向智慧融媒
权威报告:大模型深度赋能传媒行业,媒…
【前沿】专家学者话6G:从刚需、标准、试验等视角看6G网络
【前沿】专家学者话6G:从刚需、标准、…
中国移动董事长杨杰:5G-A商用城市超330个,发射全球首颗6G架构验证星
中国移动董事长杨杰:5G-A商用城市超330…
华为徐直军:智能化必将是一个长期过程,而算力是智能化的关键基础
华为徐直军:智能化必将是一个长期过程…
我还没有学会写个人说明!