遇见 YOLO26: 下一代视觉 AI。
Ultralytics
视觉 AI

感知机和神经网络:计算机视觉的基本原理

了解神经网络如何改变现代技术,从供应链中的质量控制到使用无人机的自主设施巡检。

ABAbirami Vina
5 min read
计算机视觉中的感知机和神经网络

在过去的几十年里,神经网络已成为许多人工智能 (AI) 关键创新的基石。神经网络是试图模拟人脑复杂功能的计算模型。它们帮助机器从数据中学习并识别模式,从而做出明智的决策。通过这种方式,它们推动了计算机视觉深度学习等人工智能子领域在医疗保健金融以及自动驾驶汽车等行业的发展。

了解神经网络的工作原理可以让你更好地理解作为 AI 核心的 “黑匣子”,有助于揭开前沿技术如何融入我们日常生活的神秘面纱。在本文中,我们将探索什么是神经网络、它们如何运作以及多年来它们是如何演进的。我们还将探讨它们在计算机视觉应用中所扮演的角色。让我们开始吧!

Link to this section人工智能中的感知器是什么?#

在详细讨论神经网络之前,让我们先来看看感知器。它们是神经网络中最基础的类型,也是构建更复杂模型的基石。

A perceptron is a linear machine learning algorithm used for supervised learning (learning from labeled training data). It is also known as a single-layer neural network and is typically used for binary classification tasks that differentiate between two classes of data. If you are trying to visualize a perceptron, you can think of it as a single artificial neuron.

感知机是一个单一的人工神经元

图 1. 感知器是一个人工神经元。

Link to this section了解感知器的工作原理#

感知器可以接收多个输入,将其与权重结合,确定它们属于哪个类别,并充当简单的决策者。它由四个主要参数组成:输入值(也称为节点)、权重与偏置、净和以及激活函数。

它的工作原理如下:

  • 输入与权重:假设你有几条信息(输入),每一条都有一个表示其重要性的权重。除此之外,偏置还有助于增强感知器在决策时的灵活性。
  • 计算加权和:感知器将每个输入与其权重相乘,然后将所有结果相加(包括偏置),从而得出加权和。
  • 做出决策:然后,感知器使用激活函数来确定最终输出。它利用加权和来决定感知器是否应该激活。在最简单的情况下,激活函数是一个阶跃函数,如果加权和超过某个阈值,则输出 1,否则输出 0。因此,加权输入被转换为“是”或“否”的决策。
  • 学习与改进:如果感知器犯了错误,它会调整权重以试图在下一次做得更好。这个过程有助于模型从错误中学习。

感知机概述

图 2. 感知器概述。来源:indiantechwarrior.com

Link to this section感知器在计算机视觉中的作用#

感知器在帮助我们理解计算机视觉基础方面发挥着重要作用。它们是高级神经网络的基础。与感知器不同,神经网络不仅限于单层。它们由多层相互连接的感知器组成,这使它们能够学习复杂的非线性模式。神经网络可以处理更高级的任务,并产生二进制和连续输出。例如,神经网络可用于高级计算机视觉任务,如实例分割姿态估计

Link to this section计算机视觉技术从神经网络的演进史#

神经网络的历史可以追溯到几十年前,充满了研究和有趣的发现。让我们仔细看看其中的一些关键事件。

以下是早期里程碑的快速回顾:

  • 1940 年代: Warren McCulloch 和 Walter Pitts 开发了一个简单的电路来模拟大脑的工作方式。
  • 1958 年: Rosenblatt 引入了感知器。
  • 1970 年代: Paul Werbos 提出了反向传播的概念(这是一种通过最小化预测输出与实际输出之间的差异来帮助神经网络学习的训练方法)。反向传播使训练多层神经网络成为可能,并为深度学习铺平了道路。
  • 1980 年代: Geoffrey Hinton 和 Yann LeCun 等研究人员研究了连接主义,即关于互连单元网络如何形成认知过程。他们的工作为现代神经网络奠定了基础。
  • 1990 年代: Jürgen Schmidhuber 和 Sepp Hochreiter 提出了长短期记忆 (LSTM) 网络,它已成为涉及序列预测任务的核心。

神经网络的演进

图 3。神经网络的演进。

进入 21 世纪后,神经网络的研究蓬勃发展,带来了更大的进步。在 2000 年代,Hinton 对受限玻尔兹曼机(一种在数据中发现模式的神经网络)的研究在推动深度学习方面发挥了关键作用。它使深度网络的训练变得更容易,帮助克服了复杂模型的挑战,并使深度学习变得更加实用和有效。

随后,在 2010 年代,由于大数据并行计算的兴起,研究速度迅速加快。这一时期的亮点是 AlexNet 在 2012 年 ImageNet 竞赛中的胜利。AlexNet 是一种深度卷积神经网络,它的突破性在于展示了深度学习在计算机视觉任务(如精准识别图像)中有多么强大。它助力引发了人工智能在视觉识别领域的快速增长。

今天,神经网络正随着新技术而演进,如非常适合理解序列的Transformer,以及适用于处理数据中复杂关系的图神经网络。诸如迁移学习(在某项任务中训练的模型用于另一项任务)和自监督学习(模型在无需标签数据的情况下进行学习)等技术,也在不断扩展神经网络的能力。

Link to this section理解神经网络:基础知识#

现在我们已经打好了基础,让我们来准确了解什么是神经网络。神经网络是一种机器学习模型,它使用互连的节点或神经元,其结构类似于人脑。这些节点或神经元处理并学习数据,使它们能够执行模式识别等任务。此外,神经网络具有适应性,因此它们可以从错误中学习并随着时间的推移不断改进。这使得它们能够更准确地处理诸如人脸识别等复杂问题。

神经网络

图 4. 神经网络。

神经网络由并行工作的多个处理器组成,并组织成不同的层。它们由输入层、输出层和中间的几个隐藏层组成。输入层接收原始数据,类似于我们的视神经摄入视觉信息的过程。

每一层会将输出传递给下一层,而不是直接处理原始输入,这就像大脑中的神经元彼此传递信号一样。最后一层产生网络的输出。通过这一过程,人工神经网络(ANN)可以学习执行计算机视觉任务,例如图像分类

Link to this section神经网络在计算机视觉中的工业应用#

在了解了神经网络及其工作原理后,让我们来看看一个展示神经网络在计算机视觉领域潜力的应用。

Link to this section能源行业的输电线巡检#

神经网络构成了像 Ultralytics YOLO11 等计算机视觉模型的基础,并可用于利用无人机对输电线进行视觉检查。公用事业行业在检查和维护其庞大的输电线网络时面临物流挑战。这些线路通常跨越繁忙的城市地区到偏远、崎岖的地形等各种环境。传统上,这些检查是由地面人员进行的。虽然有效,但这些人工方法成本高、耗时,并可能使工人面临环境和电气危险。研究表明,输电线作业是美国十大最危险的工作之一,每 10 万名工人中每年死亡率为 30 到 50 人。

然而,无人机巡检技术可以使航空巡检成为更实用且具成本效益的选择。前沿技术使无人机在巡检过程中可以飞行更长的距离,而无需频繁更换电池。许多无人机现在集成了 AI,具有自动避障功能和更好的故障检测能力。这些功能使它们能够在输电线密集的区域进行检查,并从更远的距离拍摄高质量图像。许多国家正在采用无人机和计算机视觉技术来进行输电线巡检任务。例如,在爱沙尼亚,100% 的输电线巡检工作均由此类无人机完成。

一名技术人员使用无人机和AI工具检查电力线

图 5. 一名技术人员正在使用无人机和 AI 工具巡检输电线(左图)以及他正在操作的无人机(右图)(suasnews)。

Link to this section关键要点#

神经网络从研究走向应用,已经走过了漫长的道路,并已成为现代技术进步的重要组成部分。它们使机器能够学习、识别模式,并利用所学知识做出明智的决策。从医疗保健、金融到自动驾驶汽车和制造业,这些网络正在推动创新并改变各个行业。随着我们继续探索和优化神经网络模型,它们重新定义我们日常生活和业务运营更多方面的潜力正变得愈发清晰。

要探索更多内容,请访问我们的 GitHub 仓库,并与我们的社区互动。在我们的解决方案页面上探索人工智能在制造业农业领域的应用。🚀

Explore solutions

Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多

让我们一起构建 AI 的未来!

开启你的机器学习未来之旅