Khám phá cách Thích ứng miền không giám sát (UDA) lấp đầy khoảng trống dữ liệu bằng cách sử dụng dữ liệu chưa được gắn nhãn. Tìm hiểu cách tối ưu hóa. Ultralytics YOLO26 là mô hình dành cho việc triển khai thực tế.
Thích ứng miền không giám sát (UDA) là một lĩnh vực chuyên biệt của học chuyển giao được thiết kế để thu hẹp khoảng cách hiệu năng giữa hai phân bố dữ liệu khác biệt nhưng có liên quan. Trong các kịch bản học máy thực tế, một mô hình thường được huấn luyện trên một tập dữ liệu "nguồn" được chú thích rất kỹ lưỡng. Tuy nhiên, khi được triển khai trong môi trường sản xuất, nó thường gặp phải một miền "đích" khác biệt về mặt hình ảnh—chẳng hạn như điều kiện ánh sáng khác nhau, cảm biến máy ảnh khác nhau hoặc các kiểu thời tiết thay đổi. Như được trình bày chi tiết trong tổng quan về thích ứng miền trên Wikipedia , các kỹ thuật UDA nhằm mục đích thích ứng một mô hình đã được huấn luyện trước đó với miền đích mới này chỉ bằng cách sử dụng dữ liệu không được gắn nhãn, giúp giảm thiểu hiệu quả sự sụt giảm hiệu năng do sự thay đổi dữ liệu mà không phải chịu chi phí gắn nhãn lại khổng lồ.
Để hiểu UDA, cần phân biệt nó với các mô hình huấn luyện thị giác máy tính tương tự. Trong khi các nguyên tắc cơ bản về học chuyển giao được khám phá trong các hướng dẫn PyTorch áp dụng kiến thức từ nhiệm vụ này sang nhiệm vụ khác một cách rộng rãi, UDA đặc biệt giải quyết các trường hợp mà miền mục tiêu thiếu bất kỳ nhãn dữ liệu thực tế nào. Ngược lại, học bán giám sát giả định rằng một phần nhỏ của tập dữ liệu mục tiêu đã được gắn nhãn. Bằng cách dựa hoàn toàn vào dữ liệu mục tiêu chưa được gắn nhãn, UDA rất cần thiết để mở rộng quy mô mô hình sang các môi trường mới, nơi việc chú thích dữ liệu thủ công là không thể hoặc quá tốn kém.
Khả năng khái quát hóa trên nhiều lĩnh vực hình ảnh là rất quan trọng đối với các hệ thống trí tuệ nhân tạo hiện đại. Hai ví dụ nổi bật bao gồm:
Nghiên cứu AI hiện đại, bao gồm các nghiên cứu từ các tổ chức như Google DeepMind về khả năng khái quát hóa mô hình mạnh mẽ và nghiên cứu của OpenAI về tính bền vững của mạng nơ-ron , nhấn mạnh một số kỹ thuật cho UDA (User-Domain Assessment - Phân tích đối kháng). Ví dụ, huấn luyện đối kháng huấn luyện mạng để trích xuất các đặc trưng không thể phân biệt được giữa miền nguồn và miền đích. Ngoài ra, các kỹ sư thường sử dụng gán nhãn giả, trong đó một mô hình phát hiện đối tượng có độ tin cậy cao tạo ra các nhãn tạm thời trên tập dữ liệu đích để tạo điều kiện cho việc tinh chỉnh liên tục.
Khi quản lý các tập dữ liệu nguồn và đích khổng lồ, Nền tảng Ultralytics cung cấp một môi trường đám mây liền mạch để tuyển chọn, trực quan hóa và tự động chú thích các hình ảnh chưa được gắn nhãn. Đối với các nhà phát triển xây dựng các quy trình suy luận được tối ưu hóa cho thiết bị biên, Ultralytics YOLO26 là kiến trúc được khuyến nghị nhờ khả năng biểu diễn đặc trưng mạnh mẽ, độ chính xác cao và hiệu quả đầu cuối tự nhiên.
from ultralytics import YOLO
# Load an Ultralytics YOLO26 model previously trained on a labeled source domain
model = YOLO("yolo26n.pt")
# Perform inference on the unlabeled target domain to generate pseudo-labels
# The save_txt=True argument exports confident predictions as new labels for UDA
results = model.predict(source="path/to/target_domain", conf=0.85, save_txt=True)
# These high-confidence pseudo-labels can now be used to fine-tune the model
Bằng cách liên tục xem xét các ấn phẩm mới nhất về thị giác máy tính trên arXiv và sử dụng các khung công tác hiệu quả, các nhóm AI có thể triển khai thành công UDA để duy trì độ chính xác của mô hình trong các điều kiện thực tế luôn thay đổi. Để được hướng dẫn thêm về việc tối ưu hóa các đường dẫn đầu vào nhằm ngăn chặn sự thay đổi miền dữ liệu, hãy xem tài liệu về tăng cường dữ liệu TensorFlow hoặc khám phá các kiến trúc tiên tiến được công bố bởi các nhóm nghiên cứu của Phòng thí nghiệm AI Stanford và MIT CSAIL .
Bắt đầu hành trình của bạn với tương lai của học máy