人工智能可以告诉高尔夫球的茶壶吗

2019-02-08 11:40:26来源:

被称为深度学习计算机网络的人工智能的形式有多聪明,这些机器与人脑的模仿程度有多接近?近年来,他们已经有了很大的改进,但仍有很长的路要走,加州大学洛杉矶分校认知心理学家团队在plos计算生物学杂志上报道。

支持者表示热衷于使用这些网络来完成许多个人任务,甚至传统上由人们执行的工作。然而,在这项研究中的五个实验的结果表明,很容易欺骗网络,并且网络使用计算机视觉识别物体的方法与人类视觉大不相同。

“这些机器有严重的局限性,我们需要了解,”加州大学洛杉矶分校的杰出心理学教授,该研究的高级作者philip kellman说。“我们说,'等等,不要那么快。'”

他说,机器视觉有缺点。在第一个实验中,心理学家展示了最好的深度学习网络之一,称为vgg-19,动物和物体的彩色图像。图像已被更改。例如,高尔夫球的表面显示在茶壶上;斑马条纹放在骆驼上;并且在大象上显示了蓝色和红色亚皆老街袜子的图案。vgg-19排名第一,选择正确的项目作为40个对象中只有5个的首选。

“我们可以很容易地欺骗这些人工系统,”联合作者,加州大学洛杉矶分校心理学教授lujing lu说。“他们的学习机制远没有人类思维复杂。”

vgg-19认为大象是大象的可能性为0%,茶壶只有0.41%的可能性是茶壶。加州大学洛杉矶分校心理学研究生尼古拉斯・贝克说,这是一个高尔夫球的第一选择,它表明人工智能网络比其形状更能看待物体的纹理。

“高尔夫球的出现是绝对合理的,但令人担忧的是,茶壶不会出现在选择中的任何地方,”凯尔曼说。“它没有变形。”

凯尔曼说,人类主要从形状上识别物体。研究人员怀疑计算机网络使用的是另一种方法。

在第二个实验中,心理学家向vgg-19展示了玻璃雕像的图像,并向第二个深度学习网络展示了alexnet。vgg-19在所有测试两个网络的实验中表现更好。两个网络都经过训练,可以使用名为imagenet的图像数据库识别物体。

然而,两个网络都表现不佳,无法识别玻璃俑。vgg-19和alexnet都没有正确地将小雕像确定为他们的首选。一个大象雕像被两个网络评为大象几率为0%。大多数热门回应令研究人员感到困惑,例如vgg-19选择“goose”的“网站”和“北极熊”的“开启者”。平均而言,alexnet在1,000个选项中排名第328位。

“这些机器与人类产生了非常不同的错误,”卢说。

在第三个实验中,研究人员向vgg-19和alexnet展示了40幅黑色轮廓图,白色图像。前三个实验旨在发现设备是否通过其形状识别物体。

这些网络在识别诸如蝴蝶,飞机和香蕉等物品方面做得很差。

该实验的目的不是欺骗网络,而是要了解他们是否以与人类相似的方式或以不同的方式识别物体,共同作者,加州大学洛杉矶分校心理学博士后学者gennady erlikhman说。

在第四个实验中,研究人员显示两个网络都有40个图像,这次是纯黑色。

使用黑色图像,网络做得更好,在大约50%的对象的前五个选项中生成正确的对象标签。例如,vgg-19排名算盘的概率为99.99%,算盘和大炮的概率为61%。相比之下,vgg-19和alexnet各自认为白锤(黑色轮廓)是锤子的可能性不到1%。

研究人员认为这些网络在黑色物体方面做得更好,因为这些物品缺乏凯尔曼所谓的“内部轮廓” - 边缘会混淆机器。

在实验五中,研究人员对图像进行了加扰,使其难以识别,但是它们保留了一些物体。研究人员选择了vgg-19网络最初获得的六张图像并对它们进行了加扰。人类发现这些难以辨认。vgg-19得到了六张图片中的五张,并且在第六张图片上接近了。

作为第五个实验的一部分,除了vgg-19之外,研究人员测试了加州大学洛杉矶分校的本科学生。十名学生被展示为黑色轮廓的物体 - 有些人难以辨认,一些人被解读,一些物体只有一秒钟,有些只要学生想要查看它们。学生们正确识别出92%的未加扰对象和23%的加扰对象只需一秒即可查看。当学生可以根据需要看到轮廓时,他们正确地识别出97%的未加扰对象和37%的加扰对象。

心理学家得出什么结论?

人类看到整个物体,而人工智能网络识别物体的碎片。

“这项研究表明,这些系统在他们接受训练的图像中得到了正确的答案而不考虑形状,”凯尔曼说。“对于人类而言,整体形状是物体识别的主要形式,而根据整体形状识别图像似乎根本不在这些深度学习系统中。”

有许多深度学习机器,研究人员认为他们的研究结果广泛适用于这些设备。

该研究部分得到了美国国家科学基金会的资助。

全身动作捕捉

全身动作捕捉

无线动作捕捉系统

动捕