创新工场、搜狗和今日头条三方联合宣布发起“AI Challenger全球AI挑战赛”。三年内,三方将投入千万元打造中国最大的科研数据集与世界级AI竞赛平台。发布会现场,官方透露,大赛第一年将开放超过1000万条中英文翻译数据、70万个人体动作分析标注数据、30万张图片场景标注和语义描述数据。
在人工智能领域,数据的数量与质量是科学研究与产品技术研发的核心。不止一次,创新工场董事长曾经公开表示过诸如百度、苹果、IBM、谷歌、Facebook等顶尖公司垄断了数据,阻碍AI行业发展。李开复表示,AI Challenger就是通过提供免费海量数据解决数据集缺失问题,为科研机构和创业公司提供更多可能性。
DoNews记者了解到,AI Challenger数据集将涵盖人体骨骼关键点数据集(用于无人驾驶、安防、体感游戏等场景)、图像中文描述数据集、中英翻译数据集等。
对于这次提供数据集的今日头条和搜狗来说,今日头条将算法、工程、产品、运营在AI应用层面的结合已经得到了市场的肯定。同时在产品中同样积累了大量文本、图像、视频等数据集和计算机视觉、自然语言理解、数据挖掘等方面AI技术。
搜狗CEO王小川则在发布会上再次强调,搜狗不是转型做AI,从始至终它就是一家AI公司。除文本数据集外,搜狗还积累了大量语音、图像视频等数据集,他透露搜狗语音输入频次每日可达到2.6亿次。除此次开放数据集外,其实已经与清华合作9年,进行产学研结合。