2018年1月30日,科学院虚拟经济与数据科学研究中心刘锋,石勇,刘颖团队公布了小米,京东和阿里智能音箱的AI智商测试结果,这是该研究团队基于2014年以来团队形成的AI IQ测试方法进行的又一次重要的人工智能测试。
该研究团队2014年第一次在世界上发表论文提出AI的标准智能模型,提出任何一个智能系统或智能产品都是一个同时具有“知识的获取,掌握,创新和反馈”的系统。只是不同智能系统在这四个方面表现强弱不同。例如鹰的识别能力很强,IBM沃森系统掌握的世界常识很多,人类科学家能够发现万有引力,相对论,创新能力很强。相声演员的语言表达能力很强等等。
基于这个模型,研究团队又将这四个领域拆分成15个更为精细的分类。如声音,图像的输入输出,常识,数学,翻译的掌握,发现规律,创作文章,猜测预测的创新能力等等。在2014年和2016年对包括SIRI,谷歌,6岁,12岁,18岁人类进行了世界第一次AI与人同时开展的智商测试。测试结果发现到2016年得分最高的谷歌离6岁儿童依然有一定差距,虽然在这两年内人工智能有了快速的发展水平,但在知识的创新领域依然进展缓慢。
刘锋、石勇、刘颖团队的研究成果受到世界范围科学界和媒体的广泛关注,2017年麻省理工科技评论,美国CBNC,日本每日新闻,以及中国,欧洲,中东等国家和地区主流媒体对AI智商的研究进行了深入的报道。
按照刘锋,石勇,刘颖团队的最新研究成果,AI产品的AI IQ分为三种,第一种是AI系统与人类以平等的身份参与测试形成的AI智商,也就是AI通用智商(AI G IQ)。第二种是AI系统作为人类的服务者,在服务人类的过程中体现的AI智商,也就是AI服务智商(AI S IQ),第三种是购买者用多少价格可以购买到多少AI服务智商,这就是用AI服务智商除以公开定价,于是就得到AI价值智商(AI V IQ)。
本次重点测试智能音箱在服务人类过程中体现的智能,因此本次没有测试AI通用智商。测试得到了小米,京东,阿里智能音箱的AI 服务智商和AI价值智商,结果如下。
从测试结果看,小米音箱在基本常识和专业技能,交互友好度等方面表现较优,在设备互联方面京东叮咚和阿里天猫精灵表现较好,原因是小米音箱目前只能控制小米的智能产品,而京东和阿里属于平台型互联网企业,合作商家多于小米音箱。阿里天猫精灵在识别用户身份上略优于其他两个品牌。
智能音箱总体在自动联网方面明显较弱,用户需要多步骤配置,不够智能。由于智能音箱主要通过声音进行交互,因此总体得分不高。但作为人类重要的交互方式,图像输入和展示未来是不是智能音箱必备的功能值得厂家关注,目前亚马逊和腾讯的智能音箱产品已经具备了图像输入和展示功能,但带来的负面影响是成本会大幅度提高。据研究团队介绍,在春节后将发布更多和更完整的智能音箱AI智商测试结果。