人工智能非常擅长识别物体。在100万张照片中,它可以准确指出哪张照片中有行人正在过马路。然而,人工智能并不适合绘制一张图片,显示有行人正在过马路。如果能做到这一点,那么人工智能就能创造出非常逼真的模拟环境,让无人驾驶汽车在这样的模拟环境中训练。
问题在于,创造新东西需要想象力,而想象力是人工智能所不擅长的。
2014年,蒙特利尔大学博士生伊安·古德费罗(Ian Goodfellow)在一家酒吧的学术辩论中首先想到了这个解决方案,这被称作“生成对抗网络”(GAN)。GAN让两个神经网络在数字版的“猫鼠游戏”中相互对抗。
两个网络都使用相同的数据集去训练。其中一个名为“生成器”,任务是利用所看到的图像去创建不同版本,例如3只手的人。而另一个名为“鉴别器”,任务是识别所看到的图像是否是生成器制造的假图像。
通过这样的过程,生成器将非常善于产生图像,导致鉴别器无法判断哪些是真实图像,哪些是假的。从本质上来看,生成器被训练去识别并制作看起来真实的图像。
过去10年,GAN成为了人工智能最有前景的领域之一,帮助机器生成能迷惑人眼的结果。
GAN已被投入使用,用于制作听起来很逼真的语音和图像。例如,英伟达的研究者向GAN提供了大量明星照片,随后创造出数百张并不存在的头像。另一个研究团队则生成了类似梵高作品的假画。更进一步,GAN可以以不同方式来重新想象画面,例如将阳光灿烂的道路变成一条雪路,或是将马变成斑马。
结果并不总是完美的:GAN或许会给自行车安上两个车把,或是把眉毛放在头像错误的地方。不过,由于生成的图像和声音往往非常真实,因此专家认为,从某种意义上来说,GAN已经开始了解所看到和听到的世界的底层结构。这意味着除了想象力之外,人工智能还能获得更独立的能力,理解所见的世界。
官方微信
扫一扫