Knowledge详细

当前位置:首页 > Google知识 > 谷歌大脑教机器学简笔画 人工智能能否理解?
记录每日热点资讯,掌握行业最新趋势返回首页

谷歌大脑教机器学简笔画 人工智能能否理解?

分享到:
浏览次数:时间:2017-04-18来源:http://www.googlegz.com/

  和具体的实物相比,简笔画虽然抽象但却是上至耄耋老人下至黄毛小孩都能理解的图像。人们能够理解团中的关键特征并将其和现实的物体进行比对,那么如果教机器学画画,它们能像人类一样理解这些抽象画,甚至画出这样的画作呢?广州谷歌推广小编带大家了解一下。

抽象画

  近日,谷歌大脑的David Ha撰文指出了和Douglas Eck 在研究sketch-rnn时产生的一些想法和观点。在两人合作的论文中,研究者设计了一个叫做“sketch-rnn”的生成式RNN,它能简单的对日常的物体进行描绘,系统旨在训练机器能够像人类一样提炼事物的抽象概念。

  研究者在一个手绘sketches 数据集中进行训练,通过控制提笔、落笔的时间和方向,从而为应用创造更多的可能,比如为艺术家提供灵感或者教学生们一些绘画的技巧等。

  采用了神经网络时由于系统的高解析度,模型很容易生成连续的图像结构,从而生成一系列诡异的图片,而谷歌大脑的研究人员则采用了更低维、基于向量的方式。Sketch-rnn 基于 seq2seq的自动编码框架,结合变分推断并采用了超网络作为 RNN 的核心。

  研究人员故意在latent vector 中添加了一些噪声,实践的结果表明尽管模型受到噪声的干扰,无法准确地进行输入但依然能捕捉到其中的关键信息。该模型并非单纯地模仿,而是先学习输入特征再根据自己的理解重新画图。

  举个简单的例子来说,研究人员画了一只有三只眼睛的猫咪,但是模型并没有画出三只眼睛的猫,而是基于常识生成了两只眼睛的猫。为了拓宽系统认识物体的多样性,研究人员还输入了很多不同的物体,结果表明神经网络已经学会了从人类的输入中抽象出猫的概念。

  研究人员发现将猫根据身体的部分进行分类,采用公式性的编码便于系统的理解,比如将不同的隐向量加在“猫头”上就能得到猫头+身子=全身猫的结果,这样的举措也能让研究者更好的研究模型是如何组织隐空间的。

  这样的实验结果令人振奋,同时研究人员们也意识到sketch-rnn未来可以应用到更多的方向。研究人员还将为sketch-rnn 的模块解码成单独模型,让系统尝试在不完整图画的基础上“脑补”内容。

标签: