联系我们

深度学习

研究人员使用AI调查反射与原始图像的差异

mm

已发表

 on

康奈尔大学的研究人员最近利用了 机器学习 系统研究图像反射与原始图像有何不同。 据《科学日报》报道研究人员小组创建的算法发现,有明显的迹象,与原始图像有所不同,即图像已被翻转或反射。

康奈尔科技大学计算机科学副教授Noah Snavely是该研究的资深作者。根据Snavely的说法,这项研究项目始于研究人员对图像在被反射时在明显和微妙的方式上的差异产生了兴趣。 Snavely解释说,即使乍一看似乎很对称的事物,在研究时也通常可以区分为反射。一世’您可以通过新的信息收集方式发现的发现引起人们的兴趣,”Snavely说,根据ScienceDaily。

研究人员专注于人物图像,并使用它们来训练算法。这样做是因为面孔看起来似乎不对称。据报道,当人工智能在区分翻转图像和原始图像的数据上进行训练时,在各种类型的图像上,AI的准确性都在60%到90%之间。

AI所学习的翻转图像的许多视觉特征非常微妙,人类在观看翻转图像时难以辨认。为了更好地解释AI用来区分翻转图像和原始图像的功能,研究人员创建了一个热图。热图显示了AI倾向于关注的图像区域。研究人员认为,人工智能用来区分翻转图像的最常见线索之一是文本。这不足为奇,研究人员从训练数据中删除了包含文本的图像,以便更好地了解翻转图像和原始图像之间的细微差别。

从训练集中删除包含文本的图像后,研究人员发现AI分类器将重点放在图像特征上,例如衬衫呼叫者,手机,手表和面部。其中一些功能具有AI可以磨练的明显,可靠的模式,例如人们经常用右手拿着手机,而衬衫领子上的按钮通常在左侧。然而,面部特征通常是高度对称的,差异很小并且对于人类观察者来说很难检测。

研究人员创建了另一个热点图,突出显示了AI倾向于关注的面孔区域。人工智能经常使用人们的眼睛,头发和胡须来检测翻转的图像。由于不清楚的原因,人们在拍摄照片时通常会稍微向左看。至于为什么头发和胡须能指示出翻转的图像,研究人员不确定,但是他们认为可以通过剃刮或梳理的方式来揭示一个人的惯用手法。尽管这些指标可能不可靠,但通过将多个指标结合在一起,研究人员可以获得更高的置信度和准确性。

这些方面将需要进行更多的研究,但是如果研究结果一致且可靠,则可以帮助研究人员找到更有效的训练机器学习算法的方法。 计算机视觉 经常使用图像的反射来训练AI,因为这是增加可用训练数据量的有效且快速的方法。分析反射图像之间的差异可能会帮助机器学习研究人员更好地了解机器学习模型中存在的偏见,这些偏见可能导致他们对图像进行不正确的分类。

就像Snavely一样 ScienceDaily引用:

“这给计算机视觉界带来了一个悬而未决的问题,那就是什么时候可以进行翻转以扩充您的数据集,什么时候不可以?一世’我希望这将使人们对这些问题有更多的思考,并开始开发工具来理解它’偏向算法。”