深圳尤洛视觉
深圳
立即加入

感知器与神经网络:计算机视觉的基本原理

Abirami Vina

5 分钟阅读

2024年10月25日

了解神经网络如何改变现代技术,从供应链中的质量控制到使用无人机进行的自主公用设施检查。

在过去的几十年里,神经网络 已经成为许多关键人工智能 (AI) 创新的基石。神经网络是试图模仿人脑复杂功能的计算模型。它们帮助机器从数据中学习并识别模式,从而做出明智的决策。通过这样做,它们在医疗保健金融自动驾驶汽车等领域实现了计算机视觉深度学习等人工智能子领域。 

了解神经网络的工作原理可以帮助您更好地理解人工智能这个“黑盒”,从而揭示尖端技术如何融入我们的日常生活并发挥作用。在本文中,我们将探讨什么是神经网络、它们如何工作以及它们多年来的发展历程。我们还将了解它们在计算机视觉应用中扮演的角色。让我们开始吧!

人工智能中的感知器是什么?

在详细讨论神经网络之前,让我们先来看看感知器。它们是最基本的神经网络类型,也是构建更复杂模型的基础。 

感知器是一种线性机器学习算法,用于监督学习(从带标签的训练数据中学习)。它也被称为单层神经网络,通常用于区分两个数据类别的二元分类任务。如果您试图可视化感知器,您可以将其视为单个人工神经元。 

图 1. 感知器是一个单个人工神经元。

理解感知器的工作原理

感知器可以接收多个输入,将它们与权重结合,判断它们属于哪个类别,并充当简单的决策者。它由四个主要参数组成:输入值(也称为节点)、权重和偏差、净和以及激活函数。 

以下是其工作原理:

  • 输入和权重:假设您有几条信息(输入),每条信息都有一个权重,表示它的重要性。除此之外,偏置有助于感知器在做决策时更加灵活。
  • 计算加权和: 感知器将每个输入乘以其权重,然后将所有内容(包括偏差)加在一起,以得出加权和。
  • 做出决策:然后,感知器使用激活函数来确定最终输出。它获取加权和,并决定感知器是否应该激活。在最简单的情况下,激活函数是一个阶跃函数,如果加权和高于某个阈值,则输出1,否则输出0。因此,加权输入被转换成一个“是”或“否”的决定。
  • 学习和改进:如果感知器出错,它会调整权重,以便下次尝试改进。 此过程 帮助模型从错误中学习
图 2. 感知器概览。来源: indiantechwarrior.com

感知器在计算机视觉中的作用

感知器在帮助我们理解计算机视觉基础知识方面发挥着重要作用。它们是高级神经网络的基础。与感知器不同,神经网络不限于单层结构,而是由多层相互连接的感知器组成,这使得它们能够学习复杂的非线性模式。神经网络可以处理更高级的任务,并产生二元和连续输出。例如,神经网络可用于高级计算机视觉任务,如实例分割姿态估计

计算机视觉技术从神经网络的演变

神经网络的历史可以追溯到几十年前,充满了研究和有趣的发现。让我们仔细看看其中的一些关键事件。 

以下是早期里程碑的快速一览:

  • 1940 年代:Warren McCulloch 和 Walter Pitts 开发了一个简单的电路来模拟大脑的工作方式。
  • 1958 年:Rosenblatt 介绍了感知器。
  • 1970年代: Paul Werbos 提出了反向传播的概念(一种训练方法,通过最小化预测输出和实际输出之间的差异来帮助神经网络学习)。反向传播使得训练多层神经网络成为可能,并为深度学习铺平了道路。
  • 1980年代: Geoffrey Hinton 和 Yann LeCun 等研究人员研究了连接主义,即相互连接的单元网络如何形成认知过程。他们的工作为现代神经网络奠定了基础。
  • 1990年代: Jürgen Schmidhuber 和 Sepp Hochreiter 提出了长短期记忆 (LSTM) 网络,该网络已成为涉及序列预测任务的关键。
图 3. 神经网络的演变。

进入21世纪,对神经网络的研究蓬勃发展,带来了更大的进步。在2000年代,Hinton在受限玻尔兹曼机(一种在数据中寻找模式的神经网络)方面的工作在推动深度学习方面发挥了关键作用。它使训练深度网络更容易,有助于克服复杂模型的挑战,并使深度学习更实用和有效。

然后在 2010 年代,由于 大数据并行计算 的兴起,研究迅速加速。 这一时期的亮点是 AlexNet 在 ImageNet 竞赛(2012 年)中获胜。AlexNet 是一种深度卷积神经网络,是一项重大突破,因为它展示了深度学习对于计算机视觉任务(如准确识别图像)的强大之处。 它帮助激发了 AI 在视觉识别领域的快速发展。 

如今,神经网络正在随着新的创新而发展,例如transformers(转换器),它非常适合理解序列,而图神经网络则非常适合处理数据中复杂的关系。迁移学习(transfer learning)(使用在一个任务上训练的模型用于另一个任务)和自监督学习(supervised learning)(模型在不需要标记数据的情况下学习)等技术也在扩展神经网络的功能。

理解神经网络:基础知识

既然我们已经打好了基础,那么让我们来了解一下什么是神经网络。神经网络是一种机器学习模型,它使用分层结构中相互连接的节点或神经元,类似于人脑。这些节点或神经元处理和学习数据,使它们能够执行诸如模式识别之类的任务。此外,神经网络具有自适应性,因此它们可以从错误中学习并随着时间的推移而改进。这使它们能够更准确地解决复杂的问题,例如面部识别

图 4. 神经网络。

神经网络由多个并行工作的处理器组成,这些处理器被组织成层。它们由一个输入层、一个输出层和几个中间的隐藏层组成。输入层接收原始数据,类似于我们的视神经接收视觉信息的方式。

然后,每一层将其输出传递到下一层,而不是直接处理原始输入,就像大脑中的神经元将信号从一个神经元发送到另一个神经元一样。最后一层产生网络的输出。通过这个过程,人工神经网络 (ANN) 可以学习执行诸如图像分类计算机视觉任务

神经网络在计算机视觉中的工业应用

在了解了什么是神经网络以及它们如何工作之后,让我们来看看一个展示神经网络在计算机视觉中潜力的应用。

能源部门中电力线的检查

神经网络构成了Ultralytics YOLO11等计算机视觉模型的基础,可用于使用无人机目视检查电力线公用事业行业在检查和维护其广泛的电力线网络时面临着后勤挑战。这些线路通常从繁忙的城市地区延伸到偏远的崎岖地形。传统上,这些检查由地面工作人员进行。虽然这些人工方法有效,但成本高昂、耗时,并且可能使工人面临环境和电气危险。研究表明,公用事业线路工作是美国十大最危险的工作之一,年死亡率为每 10 万工人中有 30 至 50 人。

然而,无人机检测技术可以使空中检测成为一种更实用、更具成本效益的选择。尖端技术使无人机可以飞行更远的距离,在检查过程中无需频繁更换电池。现在,许多无人机都集成了人工智能,具有自动避障功能和更好的故障检测能力。这些功能使它们能够检查有许多电线的拥挤地区,并从更远的距离捕捉高质量的图像。许多国家正在采用无人机和计算机视觉技术来执行电力线路巡检任务。例如,在爱沙尼亚,100% 的电力线路检查都是由这种无人机完成的。

图 5. 一名技术人员使用无人机和 AI 工具来检查电力线(左图)和他正在操作的无人机(右图)(suasnews)。

主要要点 

神经网络已经从研究走向应用,取得了长足的进步,并已成为现代技术进步的重要组成部分。它们使机器能够学习、识别模式,并使用它们所学到的知识做出明智的决策。从医疗保健和金融到自动驾驶汽车和制造业,这些网络正在推动创新并改变行业。随着我们不断探索和改进神经网络模型,它们重新定义我们日常生活和业务运营的更多方面的潜力变得越来越清晰。

要了解更多信息,请访问我们的 GitHub 存储库,并与我们的 社区互动。在我们的解决方案页面上探索 制造业农业 中的 AI 应用。🚀

让我们一起构建人工智能的未来!

开启您的机器学习未来之旅

免费开始
链接已复制到剪贴板