生成对抗网络 (GAN) 可以做很多事情——它基本上是用于生成逼真的AI 面部和深度伪造的机器学习类型。但是麻省理工学院的研究人员正在使用 GAN 来构建神经网络来教计算机如何制作比萨饼。
这项研究的标题是“如何制作披萨:学习基于组合层的 GAN 模型”,并被ZDNet在 arxiv.org 上发现。
所谓的“ PizzaGAN项目”是一种尝试“通过建立一个反映这个逐步过程的生成模型来教机器如何制作披萨”。简而言之,由于比萨饼是由多层组成的,研究人员开始通过解剖比萨饼的图像来教机器如何识别烹饪中的不同步骤。
所以,一个普通的披萨看起来是一种方式。添加浇头和配料会在视觉上改变整体外观。通过识别视觉变化,理论上,神经网络可以逆向设计正确的步骤顺序。
研究人员首先创建了一个包含约 5500 个剪贴画比萨图像的合成数据集。下一步涉及在 instagram 上使用#pizza 标签来获取真实的披萨照片。在过滤掉“不想要的”图像后,研究人员得到了 9213 张披萨照片。PizzaGAN 代码然后做两件事。
首先,它训练机器如何添加和删除单个成分,例如辣香肠,然后创建合成图像。然后另一个模型检测出现的浇头,然后通过计算深度来预测浇头在烹饪过程中出现的顺序。
因此,如果您有一张带有蘑菇、辣香肠和橄榄的比萨饼的照片,PizzaGAN 可能能够识别出这三种配料,然后看到蘑菇在上面——因此推断出最后添加的成分。(您可以在 PizzaGAN网站上尝试移除和添加成分,以及烹饪/不烹饪比萨。)
结果相当准确。不过,麻省理工学院的研究人员在他们的论文中指出,他们从合成数据集中获得了更好的结果。总的来说,他们发现实验表明,PizzaGAN 可以检测和分割披萨配料,填写应该在下面的内容,并在最少的监督下推断订单。
从长远来看,可以想象一个神经网络能够扫描一张照片,并根据配料、烹饪的彻底程度,甚至几乎看不见的香料吐出一个非常准确的食谱。事实上,这项研究主要只是展示了人工智能区分一堆令人困惑的成分的能力。
虽然披萨一切都很好,但我们这里的一些人是乳糖不耐症。为此,研究人员得出结论,PizzaGAN 中使用的相同方法可以应用于其他分层食物,如汉堡、三明治和沙拉。
研究人员指出,在非食品方面,它也可以通过数字购物助手应用于时尚等领域。想想在Clueless中 Cher 用来挑选衣服的智能壁橱的现代版本。顺便说一句,我仍在等待。