可解释的人工智能（XAI）详解 |Ultralytics

您是否曾经看到过人工智能（AI）工具（如ChatGPT ）的回复，并想知道它是如何得出这一结论的？那么，你就遇到了人工智能的 "黑箱 "问题。这是一个术语，指的是人工智能模型处理和分析数据的方式不够清晰。即使是经常与尖端人工智能算法打交道的人工智能工程师和科学家也会发现，要完全理解它们的内部工作原理是一件非常具有挑战性的事情。事实上，只有 22% 的 IT 专业人员真正了解人工智能工具的功能。

AI 模型做出决策方式的不确定性可能存在风险，尤其是在诸如医疗保健中的计算机视觉和金融领域的 AI等关键领域。然而，在应对这些挑战和提高透明度方面正在取得重大进展。

特别是，可解释 AI (XAI) 专门致力于解决这一问题。简而言之，它是一组流程和方法，可帮助人类用户理解和信任复杂机器学习算法给出的结果或输出。

XAI 可以帮助开发人员确保 AI 系统按预期工作。它还可以帮助 AI 公司满足监管标准。在本文中，我们将探讨可解释 AI 及其广泛的用例。让我们开始吧！

可解释 AI 的重要性

在使用 AI 时，可解释性是关键。对于 AI 的一个子领域——计算机视觉来说尤其如此，它广泛应用于医疗保健等行业的应用中。在这些敏感行业中使用视觉模型时，重要的是模型的运作方式对每个人都是透明且可解释的。

计算机视觉模型中的可解释性有助于用户更好地理解预测是如何做出的以及其背后的逻辑。透明度通过清晰地概述模型的局限性并确保数据以合乎道德的方式使用，从而使每个人都能清楚地了解模型的工作原理。例如，计算机视觉可以帮助放射科医生有效地识别 X 射线图像中的健康问题。

__wf_reserved_inherit — 图 1。使用视觉 AI 分析的胸部 X 光片，显示健康、患病、活动性和潜伏性结核病分类。

然而，仅仅准确的视觉系统是不够的。该系统还需要能够解释其决策。假设系统可以显示图像的哪些部分导致了其结论，那么任何输出都会更清晰。这种程度的透明度将有助于医疗专业人员仔细检查他们的发现，并确保患者护理符合医疗标准。

可解释性至关重要的另一个原因是，它可以使 AI 公司承担责任，并在用户中建立信任。值得信赖的 AI 可以让用户确信 AI 创新能够可靠地工作、做出公平的决策并负责任地处理数据。

计算机视觉中可解释 AI 的关键技术

既然我们已经讨论了可解释性在计算机视觉中的重要性，现在让我们看看视觉 AI 中使用的关键 XAI 技术。

显著性图

神经网络是受人脑启发的模型，旨在通过互连的节点（神经元）层处理数据来识别模式并做出决策。它们可用于高精度地解决复杂的计算机视觉问题。即使具有这种准确性，它们在设计上仍然是黑盒。

显著性图是一种 XAI 技术，可用于帮助理解神经网络在分析图像时所看到的内容。它还可用于在模型未按预期执行时进行故障排除。

显著性图的工作原理是关注图像的哪些部分（像素）定义了模型的预测。这个过程与反向传播非常相似，模型从预测追溯到输入。但我们不是根据误差更新模型的权重，而是只关注每个像素对预测的“重要性”。显著性图对于计算机视觉任务（如图像分类）非常有用。

例如，如果一个图像分类模型预测一张图片是狗，我们可以查看它的显著性图，以了解模型为什么认为它是狗。这有助于我们识别哪些像素对输出影响最大。显著性图会突出显示所有有助于最终预测图像是狗的像素。

类别激活映射 (CAM)

类别激活映射是另一种 XAI 技术，用于了解神经网络在进行图像分类预测时关注图像的哪些部分。它的工作方式与显著性图类似，但侧重于识别图像中的重要特征，而不是特定像素。特征是模型在图像中检测到的形状或纹理等模式或细节。

像梯度加权类激活映射 (Grad-CAM) 和 Grad-CAM++ 这样的方法建立在相同的思想之上，并进行了一些改进。

以下是 CAM 的工作原理：

在神经网络做出最终决策之前，它会使用一种称为全局平均池化 (GAP) 的步骤来简化信息。GAP 将检测到的模式中的所有像素组合成一个平均值，从而为每个特征图（检测到的模式的可视化表示）创建一个摘要。
‍
然后，每个特征图都会被赋予一个权重，该权重显示了它对于预测某个类别（如“鸟”或“猫”）的重要性。
‍
然而，CAM的一个局限性是您可能需要重新训练模型来计算这些权重，这可能非常耗时。

Grad-CAM 通过使用梯度对此进行了改进，梯度就像信号一样，显示每个特征图对最终预测的影响程度。这种方法避免了对 GAP 的需求，并且更容易了解模型关注的内容，而无需重新训练。Grad-CAM++ 通过仅关注积极影响来进一步改进，这使得结果更加清晰。

反事实解释

反事实解释是可解释 AI 的一个重要组成部分。反事实解释涉及通过考虑未发生但可能发生的替代情景或事件来描述一种情况或结果。它可以展示特定输入变量的变化如何导致不同的结果，例如：“如果 X 没有发生，Y 就不会发生。”

在人工智能和计算机视觉领域，反事实解释识别输入（例如图像或数据）中所需的最小更改，以使AI模型产生不同的特定结果。例如，改变图像中物体的颜色可能会将图像分类模型的预测从“猫”变为“狗”。

另一个很好的例子是改变面部识别系统中的角度或光照。这可能会导致模型识别出不同的人，表明输入中的微小变化如何影响模型的预测。

创建这些解释的最简单方法是通过反复试验：您可以随机更改输入的部分（例如图像或数据的特征），直到 AI 模型给出您想要的结果。其他方法包括模型无关方法，该方法使用优化和搜索技术来查找更改，以及模型特定方法，该方法依赖于内部设置或计算来识别所需的更改。

可解释 AI 在计算机视觉中的应用

既然我们已经了解了什么是 XAI 及其关键技术，我们可以了解一下它在现实生活中的应用。XAI 在许多领域都有广泛的应用。让我们深入研究一些突出其潜力的用例：

安全系统： XAI 可用于增强安全系统，例如检测护照和驾驶执照等身份证件中的变造图像。这可以确保图像的真实性，加强身份验证流程，并防止敏感应用中的欺诈活动。

自动驾驶：了解自动驾驶汽车车载视觉 AI 系统的功能和局限性，对于在实际道路上部署之前测试汽车至关重要。XAI 可以帮助汽车公司更清楚地识别和解决问题。

法律系统：支持视觉的文档分析系统越来越多地用于司法决策。XAI 支持公平的结果，并允许对自动判决进行审查。它还有助于法律专业人士理解AI模型如何做出决策。
‍
野生动物监测：相机陷阱通常用于监测野生动物并收集动物物种的数据。XAI 可用于解释 AI 如何对图像中的这些物种进行分类。通过这样做，可以使保护工作更加可靠和准确。

关于可解释 AI 的主要收获

可解释 AI 使理解 AI 系统如何工作以及它们为什么做出某些决策变得更容易。AI 模型的透明度可以建立信任和责任感。知识就是力量，有助于 AI 创新得到更负责任的应用。在医疗保健、安全、自动驾驶和法律系统等关键领域，XAI 可用于帮助开发人员和用户理解 AI 预测、识别错误并确保公平和合乎道德的使用。通过提高 AI 的透明度，XAI 弥合了技术与人类信任之间的差距，使其对于实际应用更加安全和可靠。

要了解更多信息，请访问我们的 GitHub 仓库，并与我们的社区互动。在我们的解决方案页面上探索自动驾驶汽车中的 AI 应用和农业。🚀

你需要了解的关于可解释人工智能 (XAI) 的所有信息

可解释 AI 的重要性

计算机视觉中可解释 AI 的关键技术

显著性图

类别激活映射 (CAM)

反事实解释

可解释 AI 在计算机视觉中的应用

关于可解释 AI 的主要收获

阅读更多此类别的内容

未来物体检测趋势：需要关注的 7 个关键问题

借助人工智能，足球进球更智能

探索SAM 3：Meta AI 的新细分市场模型

让我们一起构建人工智能的未来！