近日,加州大学伯克利分校(University of California, Berkeley)的研究人员正在设计一些机器人难以操控的物体,以提高计算机视觉算法处理对抗图像的性能,加强机器人抓取物体的能力。
一、对抗图像能提高计算机视觉算法能力
近几年来,许多研究人员对对抗图像进行了大量研究,这些图片被进行了微妙的修改,让计算机视觉算法都难以准确地识别出正确图像。
例如,谷歌大脑(Google Brain)的研究人员曾通过开发一种让计算机和人类都难以判断的对抗图像,以确认这项能够欺骗人工神经网络的技术,是否也能欺骗人们大脑内部的生物神经网络。
这些研究人员的目的,主要是想利用这些对抗图像来帮助他们设计更加强大的计算机视觉算法。
因为“对抗性”的本质是一种人为的恶劣条件,如果计算机算法能够处理这些对抗图像,就意味着这些算法能够处理其他大多数棘手的事情。
二、如何设计异形立方体
最近,加州大学伯克利分校的研究人员,将对抗图像训练计算机视觉算法的这一概念扩展到了机器人的抓取能力中。
研究人员将简单而普通的三维形状进行微调,令传统机器人用两个手指都难以牢固抓取。
这些对抗物体的关键点在于,它们只是看起来容易抓,但对于两指(平行颚)抓取工具来说,却很难抓取。
被调整后的对抗物体与它们的实际几何形状之间的区别是很微妙的。
例如,研究人员将一个正方体的三个平面都设计成一个浅金字塔形状,其中最小的金字塔只有10度的斜率,并且每个金字塔对面的一侧使一个规则的平面。
这样的设计导致该正方体上没有直接相对的平面,如果机器人的两指抓取工具试图夹住倾斜的表面,那么机器人施加的力会导致物体扭曲并滑落,从而抓取失败。
随着立方体形状的复杂性增加,研究人员开发对抗性版本的过程也变得越来越困难。
研究人员针对立方八面体(有八个三角形面和六个正方形面的多边形),在模拟设计中随机调整该立方体的顶点,使它得到一个没有直接相对表面的顶点。
对于更复杂的形状,如相交的圆柱体,研究人员则使用深度学习算法来生成对抗性的例子。
三、系统预测抓取成功率100%,实际仅为13%
研究人员进行这项研究的目的不仅仅是为了挫败机器人糟糕的抓取算法,而是为了开发工具,帮助机器人提高抓取物体的能力,并希望它们能可靠地在现实世界中工作。
机器人系统在规划抓取方式时,通常会寻找光滑的相对平面,这些表面对它来说是容易捏合的。
但由于研究人员设计的对抗立方体和真实立方体之间的差异很小,难以被3D传感器捕捉到,因此大多数机器人系统会将抓取任务判断得很容易,结果却以立方体扭曲并脱离机器人的控制而失败。
当研究人员在真实世界中进行初步测试时,会尝试用两个部件套在手指形成的两边平行的夹钳去夹取这个“对抗性”物体。
在每一种测试情况中,机器人系统在计算抓取成功率时都预测会100%成功,然而对抗立方体和立方十面体的实际成功率仅为13%。
研究人员表示,他们将计划用不同类型的抓取工具和吸力抓具来测试这些物体,试图找到最具对抗性的对抗物体。
结语:尝试提高机器人更好服务人类的能力
加州大学伯克利分校的研究人员利用对抗物体,来帮助计算机视觉算法提高性能的这项研究虽然还未成熟,但也为研究人员进一步加强机器人抓取能力的方式提供了有意义的参考。