Feature Extraction
探索特征提取如何将原始数据转化为可执行的见解。了解 Ultralytics YOLO26 如何自动化此过程以实现卓越的目标检测。
特征提取是机器学习 (ML) 中的一种转换过程,它将原始的高维数据转换为一组精炼的、具有信息量的属性或“特征”。原始输入数据(如高分辨率图像、音频流或非结构化文本)对于算法进行有效处理而言通常过于庞大且冗余。特征提取通过将输入精简为其最本质的组成部分来解决这一问题——保留预测建模所需的关键信息,同时剔除噪声和不相关的背景细节。这种缩减对于缓解维数灾难至关重要,确保模型保持计算效率,并能够很好地泛化到新的、未见过的数据。
Link to this section特征提取在深度学习中的角色#
在传统计算机视觉时代,专家们依赖于诸如尺度不变特征变换 (SIFT) 等手动技术来识别图像中的关键点。然而,现代深度学习 (DL) 通过自动化特征发现彻底改变了这一工作流程。
神经网络,特别是卷积神经网络 (CNNs),采用了一种称为主干网络 (backbone) 的专门架构组件来分层执行特征提取。当数据穿过网络层时,提取出的特征复杂性会增加:
- 浅层: 这些初始层充当边缘检测器,识别简单的低级结构,例如线条、角落和颜色梯度。
- 深层: 随着网络加深,这些简单的元素被聚合为高级语义表示,例如车辆的形状、人脸或特定的动物斑纹。
这些学习到的表示存储在特征图 (feature maps) 中,随后被传递给检测头以执行诸如目标检测或图像分类之类的任务。
Link to this section实际应用#
特征提取是许多先进 AI 功能背后的引擎,它将原始感官输入转换为跨不同行业的可操作洞察。
- 医疗诊断: 在医疗 AI 领域,模型分析复杂的医学影像(如 MRI 或 CT 扫描)。复杂的特征提取算法能识别组织密度或纹理中的细微异常,这些异常可能预示着早期病变。通过隔离这些关键的视觉标记,系统能够以显著更高的准确性和速度辅助放射科医生进行肿瘤检测。
- 自动驾驶: 自动驾驶汽车依靠实时特征提取来安全导航。车载摄像头将视频流传输给计算机视觉 (CV) 模型,这些模型能即时提取与车道线、交通信号灯和行人动态相关的特征。这一能力使自动驾驶车辆能够在动态环境中做出瞬间决策。
- 音频处理: 在语音助手中,原始音频波形被转换为频谱图。随后,算法会提取语音特征、音高和语调,使语音转文本系统能够理解口语,而不受说话人口音或背景噪声的影响。
Link to this section使用 Ultralytics YOLO 进行特征提取#
像 Ultralytics YOLO26 这样的顶尖架构将强大的特征提取主干直接集成到了它们的设计中。当你运行推理时,模型会自动处理图像以提取相关特征,然后再预测边界框和类别标签。
以下示例展示了如何使用预训练模型来处理图像。虽然代码很简单,但模型在内部执行了复杂的特征提取来定位目标:
from ultralytics import YOLO
# Load a pretrained YOLO26 model, which includes a learned feature extraction backbone
model = YOLO("yolo26n.pt")
# Perform inference on an image
# The model internally extracts features to locate and classify objects
results = model("https://ultralytics.com/images/bus.jpg")
# Display the resulting bounding boxes
results[0].show()对于希望管理用于训练这些特征提取器的数据集的团队,Ultralytics Platform 提供了涵盖标注、训练和部署的综合解决方案。
Link to this section区分相关术语#
要完全掌握数据科学流程,区分特征提取和类似概念是有帮助的。
- 特征提取与特征工程的区别: 虽然两者常被放在一起讨论,但特征工程是一个更广泛的术语,通常指代一种手动过程,利用领域知识来创建新变量(例如,从“价格”和“面积”计算“每平方英尺价格”)。而特征提取是一种特定技术——在深度学习中通常是自动化的——它将高维数据(如像素)投影到低维特征向量中。
- 特征提取与特征选择的区别: 特征选择涉及选择现有特征的子集而不对其进行修改,仅移除不太重要的特征以减少噪声。相反,特征提取通过转换和组合原始数据点来创建新特征,例如通过主成分分析 (PCA) 或学习到的网络权重。
通过掌握特征提取,开发者可以利用 PyTorch 和 TensorFlow 等框架来构建不仅准确,而且足够高效、能够进行边缘部署的模型。






