联系我们

AI. 101.

什么是计算机愿景?

mm

更新

 on

什么是计算机愿景?

计算机视觉算法是世界上最具变革和强大的AI系统之一。电脑视觉系统请参阅自动车辆,机器人导航,面部识别系统等中使用。但是,什么是计算机视觉算法?他们如何工作?为了回答这些问题,我们将深入了解计算机视觉,计算机视觉算法和计算机视觉系统的应用背后的理论。

计算机视觉系统如何工作?

为了充分欣赏计算机视觉系统的工作原理,让我们首先花点时间讨论人类如何识别对象。 Neurocsychology的最佳解释是如何识别对象的是描述初始阶段的模型 对象识别作为对象的基本组件,例如形式,颜色和深度的基本组件由大脑首先解释。分析了进入大脑的眼睛的信号以拉出首先是对象的边缘,这些边缘连接在一起以完成对象形式的更复杂的表示。

计算机视觉系统通过首先辨别物体的边缘,然后将这些边沿连接到物体的形式中,与人类视觉系统非常类似地操作。重要的是,因为计算机将图像解释为数字,所以计算机视觉系统需要某种方式来解释包括图像的各个像素。计算机视觉系统将为图像中的像素分配值,并且通过检查一个像素区域之间的值和另一个像素区域之间的值,计算机可以辨别边缘。例如,如果所讨论的图像是灰度,则值将从黑色(表示为0)到白色(由255表示)。彼此附近的像素值范围的突然变化将表示边缘。

比较像素值的基本原理也可以用彩色图像完成,计算机比较不同的RGB颜色通道之间的差异。所以知道我们知道计算机视觉系统如何检查像素值以解释图像,让我们看一下计算机视觉系统的体系结构。

卷积神经网络(CNNS)

计算机视觉任务中使用的主要类型的AI是一个基于卷积神经网络。什么是卷积呢?

卷积是数学过程,网络用于确定像素之间的值的差异。如果您设想像素值的网格,则会在此主电网上移动较小的网格。通过网络分析第二电网下方的值,因此网络仅在逐时检查一把像素。这通常被称为“滑动窗口”技术。由滑动窗口分析的值由网络总结,这有助于降低图像的复杂性,并使网络更容易提取模式。

卷积神经网络是分为两个不同的部分,卷积部分和完全连接的部分。网络的卷积层是特征提取器,其作业是分析图像内的像素和它们的形式表示神经网络的密集连接层可以从中学习模式。卷积层仅通过检查像素并提取图像的低级功能,如边缘。后来的卷积层将边缘连接到更复杂的形状中。到最后,网络希望具有它可以传递给完全连接的层的图像的边缘和细节的表示。

图像注释

虽然A. 卷积神经网络通过自行提取图像的模式,可以通过注释图像来大大提高计算机视觉系统的准确性。图像注释是向图像添加元数据的过程,帮助分类器检测图像中的重要对象。每当计算机视觉系统需要高度准确时,图像注释的使用很重要,例如控制自动车辆或机器人时。

有各种方式可以注释图像以改善计算机视觉分类器的性能。图像注释通常使用边界框,一个包围目标对象边缘的框,并告诉计算机将其关注将其关注在框内。语义分割是另一种类型的图像注释,其通过将图像类分配给图像中的每个像素来操作。换句话说,可以被视为“草”或“树”的每个像素将被标记为属于这些类。该技术提供了像素级精度,但创建语义分段注释比创建简单边界框更复杂和耗时。其他注释方法,如行和点也存在。

Blogger和Programmer有专业的机器学习深度学习话题。丹尼尔希望帮助别人利用AI的力量来社交。