遇见 YOLO26: 下一代视觉 AI。
Ultralytics
返回 Ultralytics 词汇表

Steering Vectors

探索控制向量(steering vectors)如何实现对神经网络的实时控制而无需重新训练。学习如何使用 Ultralytics YOLO26 进行激活工程。

Steering vectors represent meaningful, mathematical directions within the hidden activation space of a neural network that correspond to high-level concepts, such as "politeness," "truthfulness," or specific visual features. By artificially injecting or subtracting these vectors from the model's internal states during the forward pass, developers can predictably control and alter the model's behavior without updating any underlying weights. This technique, fundamentally rooted in Activation Engineering, provides zero-cost, inference-time control over deep learning systems ranging from large language models to vision architectures.

Link to this section转向向量的工作原理#

为了创建转向向量,研究人员通常使用一种称为对比激活加法 (CAA) 的方法。这涉及到将一组对比数据对(例如要求模型“有帮助”的提示与要求其“有害”的提示)输入网络。通过计算这些数据对在激活函数输出上的差异并对多个样本取平均值,从而分离出张量空间中代表该概念的特定几何方向。

实时推理期间,通过简单的PyTorch张量加法,将此向量添加至特定层或从其隐藏状态中减去。调整向量的强度允许从业者微调注入行为的程度。

Link to this section区分转向向量与相关概念#

要理解转向向量如何融入更广泛的机器学习领域,需要将其与类似方法区分开来:

  • 任务向量 任务向量通过在训练后修改实际的模型权重以合并功能,从而在权重空间中发挥作用;而转向向量则严格在运行时的激活空间中发挥作用,完全保持原始权重不受影响。
  • 表征工程 (RepE) RepE 是读取和控制内部认知状态的总体方法论框架,由人工智能安全中心等组织进行深入研究。转向向量是 RepE 控制阶段中所利用的具体数学工具。
  • 提示工程 提示工程试图通过修改用户的输入文本或图像来引导行为。转向向量绕过了输入瓶颈,直接操纵模型的内部认知处理过程。
  • 微调 传统的对齐方法(如基于人类反馈的强化学习 (RLHF))通过梯度下降永久改变模型,这需要通常由Ultralytics平台等云工具管理的繁重计算资源。转向向量完全避免了这种计算开销。

Link to this section人工智能的实际应用#

动态转向模型的能力在现代人工智能流程中带来了重大进展:

  • 增强AI安全性 通过分离与“拒绝”或“无害”相关的转向向量,工程师可以强制模型拒绝恶意指令。在OpenAI的对齐研究和Anthropic的可解释性研究的支持下,转向特定特征可以彻底改变AI的对话风格并确保严格的安全护栏。
  • 控制推理模型 近期关于高级思维架构的研究表明,转向向量可以调节内部推理链。从业者可以在复杂的问题解决过程中增加模型表达不确定性或对错误进行回溯的倾向。
  • 缓解AI偏见 通过提取代表特定社会偏见的向量,开发者可以在生成过程中减去该方向。这有效地中和了偏见并提高了公平性,且无需重新训练,同时也降低了LLM幻觉的可能性。
  • 转向计算机视觉系统 在视觉模型中,转向向量可以应用于特征图,以人为地提高网络对关键目标的敏感度。例如,目标检测模型可以被转向优先发现恶劣天气条件下的行人。

Link to this section使用PyTorch应用转向向量#

以下是在前向传递过程中对Ultralytics YOLO26模型应用激活转向干预的可运行示例。通过利用PyTorch前向钩子,你可以直接将自定义向量注入隐藏层。

import torch
from ultralytics import YOLO

# Load the recommended Ultralytics YOLO26 model for state-of-the-art vision tasks
model = YOLO("yolo26n.pt")


# Define a hook function to steer the internal activations
def steer_activations_hook(module, input, output):
    # Create a steering vector matching the output shape (for demonstration purposes)
    # In practice, this vector is pre-computed via Contrastive Activation Addition (CAA)
    steering_vector = torch.ones_like(output) * 0.1

    # Add the steering vector to the model's hidden states to alter behavior at inference
    return output + steering_vector


# Attach the hook to a middle layer (e.g., layer index 5) to inject the vector
handle = model.model.model[5].register_forward_hook(steer_activations_hook)

# Run inference on an image with the dynamically steered activations
results = model("https://ultralytics.com/images/bus.jpg")

# Remove the hook to restore the model to its original unsteered state
handle.remove()

Explore solutions

Real-time AI tailored to your operation

农业中的 AI

利用 Ultralytics YOLO 模型将视觉 AI 引入智慧农业。为农作物监测、牲畜追踪和精准农业提供支持,实现更高、更智能的产量。

了解详情
Real-time AI that works with your operation

汽车领域的 AI

利用 Ultralytics YOLO 模型将计算机视觉应用于汽车领域。视觉 AI 能提升道路安全、驾驶辅助和车辆自动化水平,从而打造更智能的道路。

了解详情
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗解决方案。医疗保健中的视觉 AI 可加速医学影像处理、实现更智能的诊断并改善患者监护。

了解详情
Real-time AI that works with your team

零售业中的AI

利用Ultralytics YOLO模型重塑零售业。视觉AI助力库存追踪、货架监控、排队管理和更智能的客户洞察。

了解详情
Real-time AI that works with your team

机器人领域的 AI

利用 Ultralytics YOLO 模型为更智能的机器提供动力。机器人领域的视觉 AI 可驱动自主导航、感知、物体跟踪和实时控制。

了解详情
Real-time AI that works with your team

制造业中的 AI

利用 Ultralytics YOLO 模型优化制造业。视觉 AI 助力质量控制、缺陷检测、PPE 合规性监控以及装配线自动化。

了解详情
Real-time AI that works with your team

物流中的 AI

利用 Ultralytics YOLO 模型简化物流。视觉 AI 支持包裹检测、分类、车辆追踪和实时仓库安全监控。

了解详情
Real-time AI tailored to your operation

农业中的 AI

利用 Ultralytics YOLO 模型将视觉 AI 引入智慧农业。为农作物监测、牲畜追踪和精准农业提供支持,实现更高、更智能的产量。

了解详情
Real-time AI that works with your operation

汽车领域的 AI

利用 Ultralytics YOLO 模型将计算机视觉应用于汽车领域。视觉 AI 能提升道路安全、驾驶辅助和车辆自动化水平,从而打造更智能的道路。

了解详情
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗解决方案。医疗保健中的视觉 AI 可加速医学影像处理、实现更智能的诊断并改善患者监护。

了解详情
Real-time AI that works with your team

零售业中的AI

利用Ultralytics YOLO模型重塑零售业。视觉AI助力库存追踪、货架监控、排队管理和更智能的客户洞察。

了解详情
Real-time AI that works with your team

机器人领域的 AI

利用 Ultralytics YOLO 模型为更智能的机器提供动力。机器人领域的视觉 AI 可驱动自主导航、感知、物体跟踪和实时控制。

了解详情
Real-time AI that works with your team

制造业中的 AI

利用 Ultralytics YOLO 模型优化制造业。视觉 AI 助力质量控制、缺陷检测、PPE 合规性监控以及装配线自动化。

了解详情
Real-time AI that works with your team

物流中的 AI

利用 Ultralytics YOLO 模型简化物流。视觉 AI 支持包裹检测、分类、车辆追踪和实时仓库安全监控。

了解详情
Real-time AI tailored to your operation

农业中的 AI

利用 Ultralytics YOLO 模型将视觉 AI 引入智慧农业。为农作物监测、牲畜追踪和精准农业提供支持,实现更高、更智能的产量。

了解详情
Real-time AI that works with your operation

汽车领域的 AI

利用 Ultralytics YOLO 模型将计算机视觉应用于汽车领域。视觉 AI 能提升道路安全、驾驶辅助和车辆自动化水平,从而打造更智能的道路。

了解详情
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗解决方案。医疗保健中的视觉 AI 可加速医学影像处理、实现更智能的诊断并改善患者监护。

了解详情
Real-time AI that works with your team

零售业中的AI

利用Ultralytics YOLO模型重塑零售业。视觉AI助力库存追踪、货架监控、排队管理和更智能的客户洞察。

了解详情
Real-time AI that works with your team

机器人领域的 AI

利用 Ultralytics YOLO 模型为更智能的机器提供动力。机器人领域的视觉 AI 可驱动自主导航、感知、物体跟踪和实时控制。

了解详情
Real-time AI that works with your team

制造业中的 AI

利用 Ultralytics YOLO 模型优化制造业。视觉 AI 助力质量控制、缺陷检测、PPE 合规性监控以及装配线自动化。

了解详情
Real-time AI that works with your team

物流中的 AI

利用 Ultralytics YOLO 模型简化物流。视觉 AI 支持包裹检测、分类、车辆追踪和实时仓库安全监控。

了解详情

让我们一起构建 AI 的未来!

开启你的机器学习未来之旅