Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Mất tiêu cự

Khám phá cách Focal Loss giải quyết sự mất cân bằng lớp trong học sâu. Tìm hiểu cách triển khai nó với... Ultralytics YOLO26 sẽ tập trung vào các ví dụ khó và cải thiện độ chính xác của mô hình.

Focal Loss là một hàm mục tiêu chuyên biệt chủ yếu được sử dụng trong học sâu để giải quyết thách thức về sự mất cân bằng lớp nghiêm trọng. Trong nhiều nhiệm vụ thị giác máy tính, chẳng hạn như phát hiện đối tượng, số lượng ví dụ nền (mẫu âm) nhiều hơn đáng kể so với các đối tượng quan tâm (mẫu dương). Các phương pháp tiêu chuẩn, như Cross-Entropy Loss được sử dụng rộng rãi, coi tất cả các lỗi như nhau, điều này thường khiến mô hình bị quá tải bởi khối lượng lớn các lỗi dễ nhận biết. classify dữ liệu nền. Focal Loss điều chỉnh phép tính tổn thất tiêu chuẩn để giảm trọng số cho các ví dụ dễ này, buộc thuật toán tối ưu hóa phải tập trung khả năng học tập của nó vào các ví dụ "khó" - những ví dụ hiếm và khó học. classify Các đối tượng đóng vai trò quan trọng đối với hiệu suất của mô hình.

Cơ chế hội tụ

Điểm đột phá cốt lõi của Focal Loss nằm ở khả năng tự động điều chỉnh mức phạt được gán cho mỗi mẫu dựa trên độ tin cậy của mô hình. Trong một kịch bản học có giám sát điển hình, một bộ dò có thể đánh giá hàng nghìn vị trí ứng cử viên trong một hình ảnh. Vì hầu hết các vị trí này không chứa đối tượng nào, một hàm mất mát tiêu chuẩn sẽ tích lũy nhiều tín hiệu lỗi nhỏ từ những trường hợp âm tính dễ nhận biết này, có thể làm lu mờ tín hiệu có giá trị từ một vài trường hợp dương tính.

Focal Loss đưa ra một yếu tố điều chỉnh làm giảm đóng góp của hàm mất mát khi độ tin cậy vào lớp chính xác tăng lên. Điều này có nghĩa là nếu mô hình đã chắc chắn 99% rằng một mảng nền thực sự là nền, thì hàm mất mát cho mảng đó sẽ giảm xuống gần bằng không. Do đó, trọng số của mô hình được cập nhật chủ yếu dựa trên các mẫu bị phân loại sai hoặc những mẫu mà mô hình không chắc chắn. Cách tiếp cận có mục tiêu này rất cần thiết để huấn luyện các bộ phát hiện đối tượng một giai đoạn hiệu suất cao như YOLO26 , cho phép chúng đạt được độ chính xác cao mà không cần các giai đoạn lấy mẫu phức tạp.

Các Ứng dụng Thực tế

Xử lý dữ liệu huấn luyện không cân bằng là rất quan trọng để triển khai các hệ thống AI mạnh mẽ trong môi trường mà an toàn và độ chính xác là tối quan trọng.

  • Trí tuệ nhân tạo trong chăm sóc sức khỏe : Trong các lĩnh vực như phân tích hình ảnh y tế , việc xác định bệnh lý thường giống như mò kim đáy bể. Ví dụ, trong ảnh chụp MRI tìm kiếm các tổn thương nhỏ, mô khỏe mạnh có thể chiếm hơn 99% số pixel. Một mô hình tiêu chuẩn có thể tối đa hóa độ chính xác đơn giản bằng cách dự đoán "khỏe mạnh" ở mọi nơi, bỏ sót chẩn đoán quan trọng. Thuật toán Focal Loss cho phép hệ thống triệt tiêu tín hiệu từ mô khỏe mạnh dồi dào và ưu tiên học các đặc điểm tinh tế của các bất thường, từ đó cải thiện khả năng phát hiện kịp thời các trường hợp cứu sống.
  • Xe tự hành : Hệ thống nhận thức dành cho xe tự lái phải đáp ứng các yêu cầu sau: detect Những người tham gia giao thông dễ bị tổn thương như người đi bộ hoặc người đi xe đạp phải di chuyển trong bối cảnh phức tạp của các tòa nhà, đường sá và bầu trời. Trong khi bối cảnh dễ dàng được nhận biết, các chướng ngại vật nhỏ hoặc ở xa lại đặt ra thách thức đáng kể. Bằng cách sử dụng Focal Loss, trí tuệ nhân tạo trong các ứng dụng ô tô có thể đảm bảo rằng hệ thống nhận thức không bỏ qua những chướng ngại vật khó nhận biết này. detect các vật thể, duy trì các tiêu chuẩn an toàn ngay cả khi các mối nguy hiểm chỉ chiếm một phần rất nhỏ trong tầm nhìn.

Thực hiện với Ultralytics

Các ultralytics Thư viện này bao gồm các triển khai tối ưu hóa của các hàm mất mát nâng cao để hỗ trợ các mô hình hiện đại nhất. Trong khi đó, Ultralytics Nền tảng Hệ thống tự động cấu hình các siêu tham số này để tối ưu hóa quá trình huấn luyện, các nhà phát triển cũng có thể truy cập trực tiếp vào các thành phần này để thực hiện nghiên cứu tùy chỉnh.

Ví dụ sau đây minh họa cách khởi tạo Focal Loss bằng cách sử dụng... ultralytics Sử dụng gói tiện ích này để tính toán sai số cho một tập hợp các dự đoán.

import torch
from ultralytics.utils.loss import FocalLoss

# Initialize Focal Loss.
# The 'gamma' parameter controls the focusing strength (higher = more focus on hard examples).
criterion = FocalLoss(gamma=1.5)

# Example: Model predictions (logits) and binary Ground Truth labels
# requires_grad=True simulates model outputs that need backpropagation
predictions = torch.tensor([[0.8], [-1.5], [0.1]], requires_grad=True)
targets = torch.tensor([[1.0], [0.0], [1.0]])

# Calculate the loss value
loss = criterion(predictions, targets)
print(f"Computed Focal Loss: {loss.item():.4f}")

Phân biệt với các khái niệm liên quan

Hiểu được vị trí của Focal Loss trong bối cảnh rộng hơn của việc đo lường lỗi giúp lựa chọn chiến lược phù hợp cho các nhiệm vụ thị giác máy tính cụ thể.

  • So sánh giữa Focal Loss và Cross-Entropy Loss : Cross-Entropy là thước đo cơ bản cho phân loại, phạt các dự đoán dựa trên lỗi logarit. Focal Loss về cơ bản là một phần mở rộng của Cross-Entropy; nếu tham số focusing được đặt bằng 0, về mặt toán học nó sẽ trở lại thành Cross-Entropy tiêu chuẩn. Điểm khác biệt chính là khả năng tự động giảm trọng số của Focal Loss đối với các kết quả âm tính dễ nhận biết, khiến nó vượt trội hơn đối với các tập dữ liệu không cân bằng như COCO .
  • So sánh giữa Focal Loss và IoU Loss : Trong khi Focal Loss được thiết kế cho việc phân loại (xác định đối tượng là ), IoU Hàm mất mát được sử dụng để định vị (xác định vị trí của một đối tượng). Các bộ dò hiện đại sử dụng hàm mất mát tổng hợp kết hợp giữa hàm mất mát tiêu điểm (Focal Loss) cho xác suất lớp và IoU - các chỉ số dựa trên cho hồi quy hộp giới hạn .
  • So sánh Focal Loss và Dice Loss : Dice Loss là một kỹ thuật khác được sử dụng để xử lý sự mất cân bằng, chủ yếu trong các tác vụ phân đoạn ảnh . Trong khi Focal Loss hoạt động trên từng pixel hoặc mẫu riêng lẻ dựa trên độ tin cậy, Dice Loss tối ưu hóa sự chồng chéo giữa các vùng dự đoán và vùng thực tế trên toàn cục. Việc sử dụng cả hai cùng nhau trong các quy trình phân đoạn phức tạp là khá phổ biến.

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay