微软研发了一款绘图机器人:你说什么它就能画出什么

2018-01-23 19:33:01 来源:TechCrunch 热度:
微软近日推出了一项新的模仿类似艺术家的人工智能技术—一个“绘图机器人”。
 
 
机器人能够根据文字描述创建一个与之相对应的图像,而且它也增加了细节,这些细节甚至超越了本身而不仅仅在所对应的文字里出现的内容。“这些现象可以说明,人工智能具有自己的想象力”,一名在微软公司的工作人员说道。
 
“如果你在必应引擎去搜索关于一只鸟的信息,你会得到一个与鸟类相关的图片。
 
但是在这里,图片是由计算机逐个像素地从头开始创建的,“微软公司在华盛顿州雷蒙德市微软研究实验室深度学习技术中心的首席研究员兼研究经理何晓东在微软最近的一篇公告中表示。
 
 “这些鸟可能在现实世界中都不存在,而它们只是代表了我们研发的人工智能对鸟类想象力的一个方面的描述。”
 
研究人员说,机器人能够生成各种图像,包括从“普通的田园场景”,如放牧家畜,甚至包括对“浮动双层巴士”的想象图。
 
微软方面表示,该机器人已经在配对图像和标题的数据集上进行了培训,该培训能够使其理解如何将相应的单词与图像进行匹配。
 
例如,当标题上写着“鸟”时,它先学会画一只鸟,然后通过机器学习来理解鸟的图像应该是什么样的。
 
何晓东说:“这是我们相信机器可以学习的根本原因之一。”
 
绘图机器人的技术由两个机器学习模型组成,一个是从文本描述生成图像,另一个是使用文本描述来判断生成图像的真实性。
 
前者试图从后者获得虚拟的照片,但后者不想被愚弄。所以通过互相之间内部的“竞争”,两者结合起来便能够共同创造更高质量的图像。
 
它尤其擅长从更复杂的句子中绘制图像,而其他技术可能会从标有“鸟”的标题中画出一只鸟,例如,如果您要求它画一只绿色的皇冠,黄色的翅膀和红色的肚皮,那么质量就会下降。
 
在微软研发该项技术之前,一般的结果便是生成一个模糊的“绿黄色微红的鸟”,微软的工作人员解释说。
 
尤其有趣的是,当没有提到具体的细节时,机器人如何填补信息空白。事实就是,基本上,由于其能够记忆训练数据,它会拥有一点自己的常识来发展想象力。
 
在搜索鸟类的这个例子中,即使没有在文本中说明,机器人通常会画一只坐在树枝上的鸟,因为最初赋予它进行学习记忆的图像通常显示类似的东西。
 
根据最近的一篇研究报告,微软方面还指出,与现有技术相比,这种新型机器人生成的图像质量相较以前提升了近三倍。
 
当然,这不是第一个研发出来的与艺术相结合的人工智能技术。
 
这两者结合有时会产生出色的结果,比如Google的人工智能机器生成的图像展现了其具有艺术表现力的潜能。
 
谷歌还有一个神经网络,可以猜测你正在绘制什么,他们还拥有一个自动绘图机器人,并定期地详细介绍它如何在帮助机器进行绘制的研究。
 
Facebook也一直在开发神经网络来制作飞机,汽车和动物等小图片,甚至用它从照片中创建自己的Bitmoji形象。
 
对于微软来说,教一个机器人根据文本来画出相对应的图像这项技术代表着它已经达到了在这个计算机视觉和自然语言处理领域所需要的技术。
 
这包括CaptionBot的自动写入照片字幕的开发,以及可以回答人们询问图像的问题的技术,如图中对象的位置或属性,这是对盲人有帮助的事物。
 
至于人工智能艺术家在现实世界中如何为人类服务,微软公司有一些想法。
 
这表明该机器人可以作为画家或室内设计师的素描助手,或者可以作为声控美化照片的工具来被使用。 (“Cortana,请你为我画一只鸟”,也许它能做到?)
 
何晓东表示,随着计算能力的增强,该技术可能会对电影动画制作有所帮助,从而减少动画师在电影后期制作所需的手工劳动量。
 
但该技术还没有达到我们能够用它完成所提出的要求的程度。
 
如果仔细观察这些图像,它们几乎都会有缺陷,我们可以很明显地看出来它们是由机器创造的,而不是人类:例如上图中的蓝喙鸟,水果和奇形怪状的香蕉图(见上文)。
 
然而,随着它的进3倍速度能力的提高,绘图机器人代表了人工智能发展的里程碑,微软公司相关人员说道。

责任编辑:吴礼得

相关推荐

IBM、微软等多家跨国巨头入驻广州开发区

新华网广州1月8日电,广州开发区2006年预计完成工业总产值2006亿元,相当于1996年广州全市的工业总产值。建区22年来广州开发区再造了一个“经济广州”。其生产总值、工业增加值、财政收入、可支配财力、工业利润等五项指标,近两年连续称冠全国49个国家级开发区。新年伊始,英特尔、IBM、微软、甲骨文、百事高等五家跨国企业巨头将携手入驻开发区,都将于今日举行开业庆典。去年5月26日,广州有史以来最大的外资项目LG飞利浦液晶显示项目也选择落户广州开发区,该项目及系列厂最终投资总额总计将达20亿美元,预计全面投产后将形成近千亿元人民币的产值。目前,广州开发区内已吸引95家世界500强跨国企业入驻,数

CBS用微软“银光”在电视节目中融入用户创作内容

哥伦比亚广播公司(CBS)的地方电视台群4月30日宣布,将应用微软(Microsoft)的“银光”(Silverlight)技术,为本地台群的网站网络,实施其创新的“社区造”电视节目内容计划。银光是微软公司针对网上音视频应用所新推出的一种跨浏览器和跨操作系统平台的插件。CBS电视台群(CBSTelevisionStations)的新计划,已经在4月30至5月2日在拉斯维加斯(LasVegas)举行的建网技术专业会议MIX07(visitmix.com)上进行了展示。该计划旨在帮助将用户创建的数字媒体内容与传统的电视广播内容相融合,于是,可以在电视台节目中捕捉到CBS电视台群遍布美国各地观众的心

微软与中华电信将携手进军IPTV

5月22日消息,微软将与台湾中华电信于今天宣布携手进军数字家庭市场,率先在网络电视(IPTV)进行合作。包括微软全球副总裁暨大中华区执行官陈永正、大中华区区域总裁黄存义、中华电信董事长贺陈旦等人都将亲自出席。中华电信董事长贺陈旦本周应邀到美国微软总部西雅图参加全球总裁高峰论坛,并且成为微软创办人比尔盖兹豪宅的座上嘉宾。中华电信之前已砸下一.七亿元采购微软MSTV平台、进行测试,未来将评估MOD平台是否全面转换成MSTV。

微软中华电信IPTV合作 增加高端家庭应用

尽管早于2003年便已推出视频点播服务MOD,台湾第一大电信运营商中华电信22日宣布将推出采用微软技术的IPTV服务,增加较高端的数字家庭应用。电信界与软件界龙头中华电信与微软今宣布结成策略联盟,在中华电信董事长贺陈旦日前赴美与微软董事长完成合作签约后,将结合两家公司在通信与信息科技上的技术优势,在数字生活、中小企业服务、NGOSS(NewGenerationOperationSystemsandSoftware,新一代操作系统与软件),以及公益活动等领域合作。不过,双方并未透露未来合作细节,但首个可端出初步成果的,则是中华电信在既有MOD(MultimediaonDemand,视频点播)之外