YOLO Vision Thâm Quyến
Thâm Quyến
Tham gia ngay
Thuật ngữ

Thích ứng miền không giám sát (UDA)

Khám phá cách Thích ứng miền không giám sát (UDA) lấp đầy khoảng trống dữ liệu bằng cách sử dụng dữ liệu chưa được gắn nhãn. Tìm hiểu cách tối ưu hóa. Ultralytics YOLO26 là mô hình dành cho việc triển khai thực tế.

Thích ứng miền không giám sát (UDA) là một lĩnh vực chuyên biệt của học chuyển giao được thiết kế để thu hẹp khoảng cách hiệu năng giữa hai phân bố dữ liệu khác biệt nhưng có liên quan. Trong các kịch bản học máy thực tế, một mô hình thường được huấn luyện trên một tập dữ liệu "nguồn" được chú thích rất kỹ lưỡng. Tuy nhiên, khi được triển khai trong môi trường sản xuất, nó thường gặp phải một miền "đích" khác biệt về mặt hình ảnh—chẳng hạn như điều kiện ánh sáng khác nhau, cảm biến máy ảnh khác nhau hoặc các kiểu thời tiết thay đổi. Như được trình bày chi tiết trong tổng quan về thích ứng miền trên Wikipedia , các kỹ thuật UDA nhằm mục đích thích ứng một mô hình đã được huấn luyện trước đó với miền đích mới này chỉ bằng cách sử dụng dữ liệu không được gắn nhãn, giúp giảm thiểu hiệu quả sự sụt giảm hiệu năng do sự thay đổi dữ liệu mà không phải chịu chi phí gắn nhãn lại khổng lồ.

Phân biệt UDA với các khái niệm liên quan

Để hiểu UDA, cần phân biệt nó với các mô hình huấn luyện thị giác máy tính tương tự. Trong khi các nguyên tắc cơ bản về học chuyển giao được khám phá trong các hướng dẫn PyTorch áp dụng kiến ​​thức từ nhiệm vụ này sang nhiệm vụ khác một cách rộng rãi, UDA đặc biệt giải quyết các trường hợp mà miền mục tiêu thiếu bất kỳ nhãn dữ liệu thực tế nào. Ngược lại, học bán giám sát giả định rằng một phần nhỏ của tập dữ liệu mục tiêu đã được gắn nhãn. Bằng cách dựa hoàn toàn vào dữ liệu mục tiêu chưa được gắn nhãn, UDA rất cần thiết để mở rộng quy mô mô hình sang các môi trường mới, nơi việc chú thích dữ liệu thủ công là không thể hoặc quá tốn kém.

Ứng dụng thực tiễn của thích ứng miền

Khả năng khái quát hóa trên nhiều lĩnh vực hình ảnh là rất quan trọng đối với các hệ thống trí tuệ nhân tạo hiện đại. Hai ví dụ nổi bật bao gồm:

  • Lái xe tự hành từ mô phỏng sang thực tế: Việc huấn luyện các mô hình cho xe tự hành phụ thuộc rất nhiều vào dữ liệu tổng hợp được tạo ra bởi các công cụ vật lý như trình mô phỏng lái xe tự hành CARLA . Các thuật toán UDA điều chỉnh phân bố trích xuất đặc trưng sao cho một mô hình được huấn luyện trên các con đường tổng hợp có thể điều hướng an toàn và chính xác trên các con đường vật lý trong thế giới thực.
  • Phân tích hình ảnh y tế liên cơ sở: Trong phân tích hình ảnh y tế , mô hình MRI được huấn luyện tại một bệnh viện thường hoạt động kém hiệu quả khi xử lý các bản quét từ phần cứng của một cơ sở khác. Các nhà nghiên cứu thường xuyên công bố các phương pháp trên các tạp chí học máy của IEEE, chứng minh cách UDA chuẩn hóa các hồ sơ hình ảnh khác nhau này mà không xâm phạm quyền riêng tư của bệnh nhân bằng cách yêu cầu chia sẻ hồ sơ chẩn đoán đã được dán nhãn.

Các chiến lược thực hiện thực tế

Nghiên cứu AI hiện đại, bao gồm các nghiên cứu từ các tổ chức như Google DeepMind về khả năng khái quát hóa mô hình mạnh mẽnghiên cứu của OpenAI về tính bền vững của mạng nơ-ron , nhấn mạnh một số kỹ thuật cho UDA (User-Domain Assessment - Phân tích đối kháng). Ví dụ, huấn luyện đối kháng huấn luyện mạng để trích xuất các đặc trưng không thể phân biệt được giữa miền nguồn và miền đích. Ngoài ra, các kỹ sư thường sử dụng gán nhãn giả, trong đó một mô hình phát hiện đối tượng có độ tin cậy cao tạo ra các nhãn tạm thời trên tập dữ liệu đích để tạo điều kiện cho việc tinh chỉnh liên tục.

Khi quản lý các tập dữ liệu nguồn và đích khổng lồ, Nền tảng Ultralytics cung cấp một môi trường đám mây liền mạch để tuyển chọn, trực quan hóa và tự động chú thích các hình ảnh chưa được gắn nhãn. Đối với các nhà phát triển xây dựng các quy trình suy luận được tối ưu hóa cho thiết bị biên, Ultralytics YOLO26 là kiến ​​trúc được khuyến nghị nhờ khả năng biểu diễn đặc trưng mạnh mẽ, độ chính xác cao và hiệu quả đầu cuối tự nhiên.

from ultralytics import YOLO

# Load an Ultralytics YOLO26 model previously trained on a labeled source domain
model = YOLO("yolo26n.pt")

# Perform inference on the unlabeled target domain to generate pseudo-labels
# The save_txt=True argument exports confident predictions as new labels for UDA
results = model.predict(source="path/to/target_domain", conf=0.85, save_txt=True)

# These high-confidence pseudo-labels can now be used to fine-tune the model

Bằng cách liên tục xem xét các ấn phẩm mới nhất về thị giác máy tính trên arXiv và sử dụng các khung công tác hiệu quả, các nhóm AI có thể triển khai thành công UDA để duy trì độ chính xác của mô hình trong các điều kiện thực tế luôn thay đổi. Để được hướng dẫn thêm về việc tối ưu hóa các đường dẫn đầu vào nhằm ngăn chặn sự thay đổi miền dữ liệu, hãy xem tài liệu về tăng cường dữ liệu TensorFlow hoặc khám phá các kiến ​​trúc tiên tiến được công bố bởi các nhóm nghiên cứu của Phòng thí nghiệm AI StanfordMIT CSAIL .

Hãy cùng nhau xây dựng tương lai của trí tuệ nhân tạo!

Bắt đầu hành trình của bạn với tương lai của học máy