Yolo Vision Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Học Liên Kết (Federated Learning)

Khám phá học liên kết: một phương pháp tiếp cận AI tập trung vào quyền riêng tư, cho phép huấn luyện mô hình phi tập trung trên các thiết bị mà không cần chia sẻ dữ liệu thô.

Học Liên Kết (Federated Learning - FL) là một kỹ thuật học máy (ML) cho phép huấn luyện các mô hình trên nhiều thiết bị hoặc máy chủ phân tán chứa các mẫu dữ liệu cục bộ mà không cần trao đổi dữ liệu. Phương pháp này giải quyết các lo ngại quan trọng về quyền riêng tư dữ liệu và bảo mật bằng cách giữ dữ liệu thô trên thiết bị của người dùng. Thay vì tập hợp dữ liệu vào một máy chủ trung tâm để huấn luyện mô hình, FL hoạt động bằng cách gửi một mô hình toàn cầu đến các thiết bị cục bộ. Mỗi thiết bị huấn luyện mô hình bằng dữ liệu riêng của nó, và chỉ các cập nhật mô hình kết quả —những cải tiến nhỏ, tập trung—được gửi trở lại một máy chủ trung tâm để tổng hợp. Quá trình hợp tác này cải thiện mô hình toàn cầu được chia sẻ mà không ảnh hưởng đến thông tin người dùng.

Federated Learning hoạt động như thế nào

Quy trình học liên kết (federated learning) thường bao gồm một chu kỳ lặp lại các bước được điều phối bởi một máy chủ điều phối trung tâm:

  1. Phân phối mô hình (Model Distribution): Máy chủ trung tâm khởi tạo một mô hình AI toàn cầu, chẳng hạn như một mạng nơ-ron, và phân phối nó đến một số thiết bị khách (ví dụ: điện thoại di động hoặc máy tính bệnh viện).
  2. Huấn luyện cục bộ: Mỗi thiết bị của khách hàng huấn luyện mô hình trên bộ dữ liệu cục bộ của nó. Vì dữ liệu này không bao giờ rời khỏi thiết bị nên nó vẫn ở chế độ riêng tư. Huấn luyện cục bộ là một thành phần quan trọng của trí tuệ trên thiết bị, thường liên quan đến Edge AI.
  3. Gửi bản cập nhật: Sau khi huấn luyện một vài lần lặp, mỗi máy khách gửi các bản cập nhật mô hình đã tính toán của nó (chẳng hạn như gradient hoặc trọng số mô hình) trở lại máy chủ trung tâm. Đây là một tải trọng nhỏ hơn và an toàn hơn nhiều so với chính dữ liệu thô.
  4. Tổng hợp An toàn: Máy chủ trung tâm tổng hợp các bản cập nhật từ tất cả các máy khách—ví dụ: bằng cách tính trung bình chúng—để cải thiện mô hình toàn cầu. Các kỹ thuật như tính toán đa bên an toàn có thể được sử dụng để đảm bảo máy chủ không thể đảo ngược kỹ thuật các bản cập nhật riêng lẻ.
  5. Cải thiện mô hình (Model Improvement): Mô hình toàn cầu được tinh chỉnh sau đó được gửi lại cho các máy khách để thực hiện vòng huấn luyện tiếp theo. Quá trình lặp đi lặp lại này tiếp tục cho đến khi hiệu suất của mô hình đạt đến mức độ chính xác (accuracy) mong muốn.

Các Ứng dụng Thực tế

Học Liên Kết không chỉ là một khái niệm lý thuyết; nó cung cấp sức mạnh cho một số ứng dụng phổ biến và đang chuyển đổi các ngành công nghiệp nơi tính nhạy cảm của dữ liệu là tối quan trọng.

  • Dự đoán Bàn phím Thông minh: Các công ty như Google sử dụng FL để cải thiện văn bản dự đoán trên bàn phím di động. Điện thoại của bạn học hỏi từ lịch sử gõ phím của bạn để đề xuất từ tiếp theo và những kiến thức này được chia sẻ dưới dạng các bản cập nhật mô hình ẩn danh để cải thiện công cụ dự đoán cho tất cả người dùng mà không cần tin nhắn thực tế của bạn rời khỏi thiết bị.
  • Nghiên Cứu Y Tế Cộng Tác: FL cho phép các bệnh viện và viện nghiên cứu cộng tác xây dựng các mô hình chẩn đoán mạnh mẽ cho các tác vụ như phân tích hình ảnh y tế để phát hiện khối u. Mỗi bệnh viện có thể huấn luyện một mô hình dùng chung trên dữ liệu bệnh nhân của mình, được bảo vệ bởi luật riêng tư như HIPAA, mà không bao giờ tiết lộ hồ sơ bệnh nhân nhạy cảm cho các tổ chức khác hoặc kho lưu trữ trung tâm. Điều này cho phép tạo ra các mô hình mạnh mẽ hơn được huấn luyện trên nhiều tập dữ liệu đa dạng.

Học Liên Kết so với các Khái Niệm Liên Quan

Điều quan trọng là phải phân biệt FL với các mô hình học khác:

  • Huấn luyện tập trung: Phương pháp truyền thống, trong đó tất cả dữ liệu được thu thập ở một nơi để huấn luyện. FL là phương pháp hoàn toàn ngược lại, được thiết kế đặc biệt để tránh tập trung dữ liệu.
  • Huấn luyện phân tán (Distributed Training): Kỹ thuật này cũng sử dụng nhiều máy để tăng tốc quá trình huấn luyện, nhưng nó giả định rằng dữ liệu huấn luyện được lưu trữ ở một vị trí trung tâm và có thể được phân phối tự do giữa các nút huấn luyện. Ngược lại, FL hoạt động với dữ liệu vốn đã phân tán và không thể di chuyển được.
  • Học chủ động (Active Learning): Phương pháp này tập trung vào việc lựa chọn hiệu quả các điểm dữ liệu giàu thông tin nhất để được dán nhãn nhằm giảm chi phí chú thích. Trong khi FL giải quyết vấn đề ở đâu quá trình huấn luyện diễn ra, thì học chủ động giải quyết vấn đề dữ liệu nào được sử dụng. Hai điều này có thể được kết hợp để tăng cường hơn nữa quyền riêng tư và hiệu quả, như được thảo luận trong blog về Học chủ động (Active Learning) này.

Những thách thức và khuôn khổ

Mặc dù có những ưu điểm, FL phải đối mặt với những thách thức như chi phí liên lạc cao, quản lý các thiết bị có sức mạnh tính toán khác nhau (CPU/GPU) và xử lý dữ liệu không phải IID (không được phân phối độc lập và giống hệt nhau), điều này có thể làm sai lệch mô hình. Hệ thống cũng có thể dễ bị tấn công đối nghịch nhắm vào các bản cập nhật mô hình. Để giải quyết những phức tạp này, các framework như TensorFlow FederatedPySyft từ các tổ chức như OpenMined đã được phát triển. Khi công nghệ trưởng thành, việc quản lý toàn bộ triển khai mô hình và vòng đời giám sát trở nên quan trọng, một quy trình được đơn giản hóa bởi các nền tảng như Ultralytics HUB.

Tham gia cộng đồng Ultralytics

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay
Đã sao chép liên kết vào clipboard