神经网络与计算机视觉基础 |Ultralytics

在过去的几十年里，神经网络已经成为许多关键人工智能 (AI) 创新的基石。神经网络是试图模仿人脑复杂功能的计算模型。它们帮助机器从数据中学习并识别模式，从而做出明智的决策。通过这样做，它们在医疗保健、金融和自动驾驶汽车等领域实现了计算机视觉和深度学习等人工智能子领域。

了解神经网络的工作原理可以帮助您更好地理解人工智能这个“黑盒”，从而揭示尖端技术如何融入我们的日常生活并发挥作用。在本文中，我们将探讨什么是神经网络、它们如何工作以及它们多年来的发展历程。我们还将了解它们在计算机视觉应用中扮演的角色。让我们开始吧！

人工智能中的感知器是什么？

在详细讨论神经网络之前，让我们先来看看感知器。它们是最基本的神经网络类型，也是构建更复杂模型的基础。

感知器是一种线性机器学习算法，用于监督学习（从带标签的训练数据中学习）。它也被称为单层神经网络，通常用于区分两个数据类别的二元分类任务。如果您试图可视化感知器，您可以将其视为单个人工神经元。

理解感知器的工作原理

感知器可以接收多个输入，将它们与权重相结合，决定它们属于哪个类别，并充当简单的决策者。它由四个主要参数组成：输入值（也称为节点）、 weights and biases网和，以及激活函数。

以下是其工作原理：

输入和权重：假设您有几条信息（输入），每条信息都有一个权重，表示它的重要性。除此之外，偏置有助于感知器在做决策时更加灵活。
‍
计算加权和: 感知器将每个输入乘以其权重，然后将所有内容（包括偏差）加在一起，以得出加权和。
‍
做出决策：然后，感知器使用激活函数来确定最终输出。它获取加权和，并决定感知器是否应该激活。在最简单的情况下，激活函数是一个阶跃函数，如果加权和高于某个阈值，则输出1，否则输出0。因此，加权输入被转换成一个“是”或“否”的决定。
‍
学习和改进：如果感知器出错，它会调整权重，以便下次尝试改进。此过程帮助模型从错误中学习。

感知器在计算机视觉中的作用

感知器在帮助我们理解计算机视觉基础知识方面发挥着重要作用。它们是高级神经网络的基础。与感知器不同，神经网络并不局限于单层。它们由多层相互连接的感知器组成，这使它们能够学习复杂的非线性模式。神经网络可以处理更高级的任务，并产生二进制和连续输出。例如，神经网络可用于实例分割和姿势估计等高级计算机视觉任务。

计算机视觉技术从神经网络的演变

神经网络的历史可以追溯到几十年前，充满了研究和有趣的发现。让我们仔细看看其中的一些关键事件。

以下是早期里程碑的快速一览：

1940 年代：Warren McCulloch 和 Walter Pitts 开发了一个简单的电路来模拟大脑的工作方式。
‍
1958 年：Rosenblatt 介绍了感知器。
‍
1970年代： Paul Werbos 提出了反向传播的概念（一种训练方法，通过最小化预测输出和实际输出之间的差异来帮助神经网络学习）。反向传播使得训练多层神经网络成为可能，并为深度学习铺平了道路。
‍
1980年代： Geoffrey Hinton 和 Yann LeCun 等研究人员研究了连接主义，即相互连接的单元网络如何形成认知过程。他们的工作为现代神经网络奠定了基础。
‍
1990年代： Jürgen Schmidhuber 和 Sepp Hochreiter 提出了长短期记忆 (LSTM) 网络，该网络已成为涉及序列预测任务的关键。

进入21世纪，对神经网络的研究蓬勃发展，带来了更大的进步。在2000年代，Hinton在受限玻尔兹曼机（一种在数据中寻找模式的神经网络）方面的工作在推动深度学习方面发挥了关键作用。它使训练深度网络更容易，有助于克服复杂模型的挑战，并使深度学习更实用和有效。

随后，在 2010 年代，由于大数据和并行计算的兴起，研究迅速加速。这一时期的一大亮点是 AlexNet 在 ImageNet竞赛中获胜（2012 年）。AlexNet是一种深度卷积神经网络，它是一项重大突破，因为它展示了深度学习在计算机视觉任务（如准确识别图像）中的强大功能。它推动了人工智能在视觉识别领域的快速发展。

如今，神经网络正在随着新的创新而发展，例如transformers（转换器），它非常适合理解序列，而图神经网络则非常适合处理数据中复杂的关系。迁移学习（transfer learning）（使用在一个任务上训练的模型用于另一个任务）和自监督学习（supervised learning）（模型在不需要标记数据的情况下学习）等技术也在扩展神经网络的功能。

理解神经网络：基础知识

既然我们已经打好了基础，那么让我们来了解一下什么是神经网络。神经网络是一种机器学习模型，它使用分层结构中相互连接的节点或神经元，类似于人脑。这些节点或神经元处理和学习数据，使它们能够执行诸如模式识别之类的任务。此外，神经网络具有自适应性，因此它们可以从错误中学习并随着时间的推移而改进。这使它们能够更准确地解决复杂的问题，例如面部识别。

神经网络由多个并行工作的处理器组成，这些处理器被组织成层。它们由一个输入层、一个输出层和几个中间的隐藏层组成。输入层接收原始数据，类似于我们的视神经接收视觉信息的方式。

然后，每一层将其输出传递到下一层，而不是直接处理原始输入，就像大脑中的神经元将信号从一个神经元发送到另一个神经元一样。最后一层产生网络的输出。通过这个过程，人工神经网络 (ANN) 可以学习执行诸如图像分类等计算机视觉任务。

神经网络在计算机视觉中的工业应用

在了解了什么是神经网络以及它们如何工作之后，让我们来看看一个展示神经网络在计算机视觉中潜力的应用。

能源部门中电力线的检查

神经网络是计算机视觉模型的基础，例如 Ultralytics YOLO11等计算机视觉模型的基础，并可用于使用无人机对电力线路进行视觉检测。公用事业行业在检查和维护其庞大的电力线网络时面临着后勤方面的挑战。从繁忙的城市地区到偏远、崎岖的地形，这些线路往往绵延不绝。传统上，这些检查都是由地面工作人员进行的。这些人工方法虽然有效，但成本高、耗时长，而且会使工人面临环境和电气危险。研究表明，公用事业线路工作是美国十大最危险的工作之一，每年每 10 万名工人中有 30 到 50 人死亡。

然而，无人机检测技术可以使空中检测成为一种更实用、更具成本效益的选择。尖端技术使无人机可以飞行更远的距离，在检查过程中无需频繁更换电池。现在，许多无人机都集成了人工智能，具有自动避障功能和更好的故障检测能力。这些功能使它们能够检查有许多电线的拥挤地区，并从更远的距离捕捉高质量的图像。许多国家正在采用无人机和计算机视觉技术来执行电力线路巡检任务。例如，在爱沙尼亚，100% 的电力线路检查都是由这种无人机完成的。

图 5. 一名技术人员使用无人机和 AI 工具来检查电力线（左图）和他正在操作的无人机（右图）(suasnews)。

主要要点

神经网络已经从研究走向应用，取得了长足的进步，并已成为现代技术进步的重要组成部分。它们使机器能够学习、识别模式，并使用它们所学到的知识做出明智的决策。从医疗保健和金融到自动驾驶汽车和制造业，这些网络正在推动创新并改变行业。随着我们不断探索和改进神经网络模型，它们重新定义我们日常生活和业务运营的更多方面的潜力变得越来越清晰。

要了解更多信息，请访问我们的 GitHub 存储库，并与我们的社区互动。在我们的解决方案页面上探索制造业和农业中的 AI 应用。🚀

感知器与神经网络：计算机视觉的基本原理

人工智能中的感知器是什么？

理解感知器的工作原理

感知器在计算机视觉中的作用

计算机视觉技术从神经网络的演变

理解神经网络：基础知识

神经网络在计算机视觉中的工业应用

能源部门中电力线的检查

主要要点

阅读更多此类别的内容

理解为何人机协同标注至关重要

Oakley Meta AI眼镜正以视觉人工智能技术重新定义眼镜行业

计算机视觉技术正推动更智能的观鸟双筒望远镜发展

让我们一起构建人工智能的未来！