遇见 YOLO26: 下一代视觉 AI。
Ultralytics
返回 Ultralytics 词汇表

Task Arithmetic

发现任务算术如何利用权重更新来编辑模型行为。学习在不完全重新训练的情况下合并任务或在 Ultralytics YOLO26 中取消学习特征。

任务算术是一种先进的机器学习技术,它通过增加或减去特定的权重更新来修改预训练神经网络的行为。开发者无需从零开始全面重新训练模型,而是可以提取基础模型与微调模型之间学到的差异。这些差异本质上是体现特定能力或行为的方向性更新。通过对这些更新应用基本的加减数学运算,开发者可以动态地编辑深度学习系统。这种范式在最近关于任务算术的 arXiv 研究中获得了极大的关注,为使大规模模型适应新需求提供了一种轻量级且计算效率高的方法。

Link to this section概念原理#

The foundation of this technique relies on calculating the difference in model weights between a base pre-trained model and a version that has undergone fine-tuning on a specific dataset. This isolated difference becomes a localized representation of the new skill. By directly manipulating PyTorch state dictionaries or utilizing TensorFlow training methodologies, engineers can scale and combine these weight differences. For instance, subtracting a specific weight update can force a model to "forget" a learned behavior, a concept heavily explored in Anthropic research on model safety.

Link to this section实际应用#

任务算术为现代计算机视觉和自然语言处理流水线开启了多种高效的工作流程:

  • 多任务能力合并:工程师可以分别在两个独立的数据集上训练Ultralytics YOLO26基础模型——一个用于专业的目标检测,另一个用于图像分类。通过计算这两个任务的权重差异并将其加回到基础模型中,最终的网络可以在不产生灾难性遗忘的情况下同时执行这两项任务。
  • 针对性遗忘以保障 AI 安全:如果视觉模型无意中从训练数据中学到了有偏差的特征,研究人员可以对该模型的副本进行微调以专门针对偏差数据,提取出特定的权重差异,并将其从原始模型中减去。正如各种Google DeepMind 的发现中所指出的,这有效地清除了不需要的行为,同时保留了模型通用的人工智能能力

Link to this section区分相关概念#

在浏览 IEEE Xplore 档案ACM 数字图书馆时,很容易将任务算术与相关方法混淆:

  • 任务向量:这些是算术过程中使用的实际数学张量(即计算出的权重差异)。任务算术是加减这些向量的总体框架。
  • 模型合并:这是组合多个模型的更广泛术语。虽然算术是合并模型的一种方式,但合并还可以涉及复杂的路由网络或集成学习。
  • 迁移学习:根据 Wikipedia 迁移学习概念,这涉及将一个任务的知识作为另一个任务的起点,这通常需要进一步的训练循环。任务算术则纯粹通过直接的权重计算来修改行为,而无需额外的训练循环。

Link to this section实现算术运算#

在实践中应用这些模型优化策略需要谨慎管理模型的内部状态。下面是一个使用 PyTorch 计算和应用更新的示例,这是一种在近期计算机视觉论文中经常讨论的技术。

import torch

# Load the state dictionaries of the pre-trained base and fine-tuned models
base_weights = torch.load("yolo26_base.pt")
tuned_weights = torch.load("yolo26_tuned.pt")

# Calculate the task vector and add it back to the base model with a scaling factor
scaling_factor = 0.5
for key in base_weights.keys():
    task_vector = tuned_weights[key] - base_weights[key]
    base_weights[key] += scaling_factor * task_vector

对于管理复杂数据标注流水线和多个微调模型版本的团队来说,Ultralytics Platform 提供了一个简化的环境来监管云端训练和无缝部署,从而使迭代模型改进的管理变得更加高效。

Explore solutions

Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多

让我们一起构建 AI 的未来!

开启你的机器学习未来之旅