Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Học Liên Kết (Federated Learning)

Khám phá cách học tập liên kết cho phép huấn luyện mô hình phi tập trung trong khi vẫn bảo vệ quyền riêng tư dữ liệu. Tìm hiểu cách huấn luyện. Ultralytics YOLO26 hoạt động an toàn trên các thiết bị biên.

Học liên kết (Federated learning) là một kỹ thuật học máy phi tập trung cho phép nhiều thiết bị cùng nhau huấn luyện một mô hình mà không cần chia sẻ dữ liệu huấn luyện thô. Không giống như các phương pháp tập trung truyền thống, nơi dữ liệu được tổng hợp vào một kho dữ liệu hoặc máy chủ duy nhất, học liên kết đưa mô hình đến với dữ liệu. Cách tiếp cận này thay đổi căn bản cách chúng ta giải quyết vấn đề quyền riêng tư và bảo mật dữ liệu , cho phép các tổ chức sử dụng thông tin nhạy cảm được lưu trữ trên điện thoại thông minh, thiết bị IoT hoặc máy chủ riêng trong khi vẫn đảm bảo dữ liệu không bao giờ rời khỏi nguồn gốc ban đầu.

Cách thức hoạt động của quy trình liên kết

Cơ chế cốt lõi của học tập liên kết bao gồm một chu kỳ lặp đi lặp lại của quá trình giao tiếp giữa máy chủ trung tâm và các thiết bị khách tham gia. Quá trình này cho phép cải thiện liên tục mạng lưới thần kinh toàn cầu mà không ảnh hưởng đến tính ẩn danh của người dùng.

  1. Khởi tạo mô hình toàn cầu : Một máy chủ trung tâm khởi tạo một mô hình nền tảng chung và phát sóng nó đến một nhóm thiết bị khách đủ điều kiện đã được chọn.
  2. Huấn luyện cục bộ : Mỗi máy khách thực hiện huấn luyện mô hình một cách độc lập bằng cách sử dụng tập dữ liệu riêng, cục bộ của mình. Điều này tận dụng khả năng của Trí tuệ nhân tạo biên (Edge AI) để tính toán các bản cập nhật ngay trên thiết bị.
  3. Tổng hợp cập nhật : Thay vì tải lên hình ảnh hoặc văn bản thô, các máy khách chỉ gửi các bản cập nhật mô hình của chúng — cụ thể là độ dốc đã tính toán hoặc trọng số mô hình — trở lại máy chủ trung tâm.
  4. Cải tiến toàn cầu : Máy chủ sử dụng các thuật toán như Trung bình liên kết (Federated Averaging - FedAvg) để kết hợp các bản cập nhật đa dạng này thành một mô hình toàn cầu mới, vượt trội hơn.
  5. Lặp lại : Mô hình được cải tiến sẽ được gửi lại cho khách hàng, và chu kỳ này lặp lại cho đến khi hệ thống đạt được độ chính xác mong muốn.

Học tập liên bang so với đào tạo phân tán

Điều quan trọng là phải phân biệt học tập liên kết (federated learning) với các mô hình huấn luyện tương tự, vì chúng giải quyết các vấn đề kỹ thuật khác nhau.

  • Huấn luyện phân tán : Điều này thường diễn ra trong một môi trường được kiểm soát, chẳng hạn như một trung tâm dữ liệu duy nhất, nơi một tập dữ liệu khổng lồ, tập trung được chia nhỏ trên nhiều GPU để tăng tốc độ tính toán. Mục tiêu chính là tốc độ xử lý, và các nút được kết nối bằng các liên kết băng thông cao.
  • Học tập liên kết (Federated Learning ): Phương pháp này hoạt động trong môi trường không được kiểm soát với các thiết bị không đồng nhất (như điện thoại di động) có thời lượng pin và kết nối mạng khác nhau. Mục tiêu chính là bảo mật và truy cập dữ liệu, chứ không nhất thiết là tốc độ xử lý thô.

Các Ứng dụng Thực tế

Khả năng đào tạo trên dữ liệu phi tập trung đã mở ra những cánh cửa mới cho các ngành công nghiệp phải tuân thủ các quy định nghiêm ngặt.

  • Trí tuệ nhân tạo trong chăm sóc sức khỏe : Các bệnh viện có thể hợp tác để huấn luyện các mô hình phát hiện khối u mạnh mẽ bằng cách sử dụng phân tích hình ảnh y tế mà không cần chia sẻ hồ sơ bệnh nhân. Điều này cho phép các tổ chức hưởng lợi từ tập dữ liệu lớn hơn trong khi vẫn tuân thủ các quy định HIPAA .
  • Bàn phím dự đoán : Hệ điều hành di động sử dụng học tập liên kết để cải thiện khả năng dự đoán từ tiếp theo và xử lý ngôn ngữ tự nhiên (NLP) . Bằng cách học hỏi từ các mẫu gõ phím cục bộ, điện thoại cải thiện trải nghiệm người dùng mà không cần truyền tải tin nhắn riêng tư lên đám mây.
  • Trí tuệ nhân tạo trong ngành ô tô : Các đội xe tự lái có thể học hỏi từ điều kiện đường xá địa phương và sự can thiệp của người lái. Những hiểu biết này được tổng hợp để cập nhật khả năng tự lái của đội xe mà không cần tải lên hàng terabyte dữ liệu video thô lên máy chủ trung tâm.

Ví dụ về mã: Mô phỏng bản cập nhật máy khách cục bộ

Trong quy trình làm việc liên kết, nhiệm vụ của máy khách là tinh chỉnh mô hình toàn cầu trên một tập dữ liệu nhỏ, cục bộ. Tiếp theo Python Đoạn mã này minh họa cách một máy khách có thể thực hiện một vòng huấn luyện cục bộ bằng cách sử dụng mô hình YOLO26 hiện đại.

from ultralytics import YOLO

# Load the global model received from the central server
# In a real FL system, this weight file is downloaded from the aggregator
model = YOLO("yolo26n.pt")

# Perform local training on the client's private data
# We train for 1 epoch to simulate a single round of local contribution
results = model.train(data="coco8.yaml", epochs=1, imgsz=640)

# The updated 'best.pt' weights would now be extracted
# and sent back to the central server for aggregation
print("Local training round complete. Weights ready for transmission.")

Ưu điểm và định hướng tương lai

Ưu điểm chính của học tập liên kết là tính bảo mật ngay từ khâu thiết kế . Nó cho phép các nhà phát triển huấn luyện trên dữ liệu tổng hợp hoặc các trường hợp ngoại lệ trong thế giới thực mà nếu không sẽ không thể truy cập được do các luật về bảo mật như GDPR . Hơn nữa, nó giảm chi phí băng thông mạng vì dữ liệu video hoặc hình ảnh độ phân giải cao vẫn được lưu trữ cục bộ.

Tuy nhiên, vẫn còn những thách thức, đặc biệt là liên quan đến tính không đồng nhất của hệ thống (các thiết bị khác nhau có sức mạnh xử lý khác nhau) và bảo mật chống lại các cuộc tấn công từ đối thủ . Về mặt lý thuyết, các máy khách độc hại có thể gửi các bản cập nhật "độc hại" để làm hỏng mô hình toàn cục. Để giảm thiểu điều này, các kỹ thuật tiên tiến như bảo mật vi sai thường được tích hợp để thêm nhiễu thống kê vào các bản cập nhật, đảm bảo không thể phân tích ngược đóng góp của bất kỳ người dùng nào.

Các công cụ như Nền tảng Ultralytics đang phát triển để giúp quản lý sự phức tạp của việc huấn luyện mô hình trong các môi trường đa dạng, đảm bảo tương lai của AI vừa mạnh mẽ vừa bảo mật. Các khung công tác tiên tiến như TensorFlow FederatedPySyft tiếp tục vượt qua giới hạn của những gì có thể đạt được với máy học phi tập trung bảo vệ quyền riêng tư.

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay