Federated Learning

Khám phá cách học liên kết (federated learning) cho phép huấn luyện mô hình phi tập trung trong khi vẫn bảo vệ quyền riêng tư dữ liệu. Tìm hiểu cách huấn luyện Ultralytics YOLO26 trên các thiết bị biên một cách an toàn.

Federated learning là một kỹ thuật học máy phi tập trung cho phép nhiều thiết bị cùng cộng tác huấn luyện một model mà không cần chia sẻ dữ liệu huấn luyện thô. Khác với các phương pháp tập trung truyền thống, nơi dữ liệu được tổng hợp vào một data lake hoặc máy chủ duy nhất, federated learning đưa model đến với dữ liệu. Phương pháp này thay đổi cơ bản cách chúng ta giải quyết data privacy và bảo mật, cho phép các tổ chức tận dụng thông tin nhạy cảm nằm trên điện thoại thông minh, thiết bị IoT hoặc máy chủ riêng trong khi đảm bảo rằng dữ liệu không bao giờ rời khỏi nguồn gốc ban đầu.

Link to this sectionQuy trình Federated hoạt động như thế nào#

Cơ chế cốt lõi của federated learning bao gồm một chu kỳ lặp lại việc giao tiếp giữa máy chủ trung tâm và các thiết bị khách tham gia. Quá trình này cho phép cải tiến liên tục một neural network toàn cầu mà không làm ảnh hưởng đến tính ẩn danh của người dùng.

Khởi tạo Global Model: Một máy chủ trung tâm khởi tạo một foundation model chung và phát nó tới một nhóm các thiết bị khách đủ điều kiện được chọn.
Huấn luyện cục bộ (Local Training): Mỗi thiết bị khách thực hiện model training một cách độc lập bằng cách sử dụng tập dữ liệu riêng tư, cục bộ của chính nó. Điều này tận dụng khả năng của Edge AI để tính toán các bản cập nhật ngay trên thiết bị.
Tổng hợp cập nhật (Update Aggregation): Thay vì tải lên hình ảnh hoặc văn bản thô, thiết bị khách chỉ gửi các bản cập nhật model của chúng—cụ thể là các gradient được tính toán hoặc model weights—trở lại máy chủ trung tâm.
Cải tiến toàn cầu (Global Improvement): Máy chủ sử dụng các thuật toán như Federated Averaging (FedAvg) để kết hợp các bản cập nhật đa dạng này thành một global model mới, ưu việt hơn.
Lặp lại (Iteration): Model đã cải tiến được gửi trở lại các thiết bị khách và chu kỳ lặp lại cho đến khi hệ thống đạt được accuracy mong muốn.

Link to this sectionSo sánh Federated Learning với Distributed Training#

Việc phân biệt federated learning với các mô hình huấn luyện tương tự là rất quan trọng, vì chúng giải quyết các bài toán kỹ thuật khác nhau.

Distributed Training: Quá trình này thường diễn ra trong môi trường được kiểm soát, chẳng hạn như một trung tâm dữ liệu duy nhất, nơi một tập dữ liệu tập trung khổng lồ được chia nhỏ trên nhiều GPUs để tăng tốc độ tính toán. Mục tiêu chính là tốc độ xử lý và các node được kết nối bằng các liên kết băng thông cao.
Federated Learning: Hoạt động trong môi trường không được kiểm soát với các thiết bị không đồng nhất (như điện thoại di động) có thời lượng pin và kết nối mạng khác nhau. Mục tiêu chính là quyền riêng tư và truy cập dữ liệu, không nhất thiết là tốc độ thô.

Link to this sectionCác ứng dụng trong thực tế#

Khả năng huấn luyện trên dữ liệu phi tập trung đã mở ra những hướng đi mới cho các ngành công nghiệp bị ràng buộc bởi các quy định tuân thủ nghiêm ngặt.

AI in Healthcare: Các bệnh viện có thể cộng tác để huấn luyện các model phát hiện khối u mạnh mẽ bằng cách sử dụng medical image analysis mà không cần chia sẻ hồ sơ bệnh nhân. Điều này cho phép các tổ chức hưởng lợi từ tập dữ liệu lớn hơn trong khi vẫn tuân thủ HIPAA regulations.
Bàn phím dự đoán: Các hệ điều hành di động sử dụng federated learning để cải thiện khả năng dự đoán từ tiếp theo và natural language processing (NLP). Bằng cách học từ các kiểu gõ cục bộ, điện thoại cải thiện trải nghiệm người dùng mà không cần truyền tin nhắn riêng tư lên đám mây.
AI in Automotive: Các đội xe tự hành có thể học hỏi từ điều kiện đường xá cục bộ và các can thiệp của tài xế. Những thông tin chi tiết này được tổng hợp để cập nhật khả năng tự lái của đội xe mà không cần tải lên hàng terabyte video thô lên máy chủ trung tâm.

Link to this sectionVí dụ mã nguồn: Mô phỏng cập nhật client cục bộ#

Trong quy trình federated, công việc của client là tinh chỉnh (fine-tune) global model trên một tập dữ liệu cục bộ, nhỏ. Đoạn mã Python sau đây minh họa cách một client có thể thực hiện một vòng huấn luyện cục bộ bằng cách sử dụng YOLO26 model hiện đại nhất.

from ultralytics import YOLO

# Load the global model received from the central server
# In a real FL system, this weight file is downloaded from the aggregator
model = YOLO("yolo26n.pt")

# Perform local training on the client's private data
# We train for 1 epoch to simulate a single round of local contribution
results = model.train(data="coco8.yaml", epochs=1, imgsz=640)

# The updated 'best.pt' weights would now be extracted
# and sent back to the central server for aggregation
print("Local training round complete. Weights ready for transmission.")

Link to this sectionƯu điểm và định hướng tương lai#

Ưu điểm chính của federated learning là privacy-by-design (quyền riêng tư được thiết kế ngay từ đầu). Nó cho phép các nhà phát triển huấn luyện trên synthetic data hoặc các trường hợp biên (edge cases) trong thế giới thực mà lẽ ra không thể tiếp cận được do các luật về quyền riêng tư như GDPR. Hơn nữa, nó giúp giảm chi phí băng thông mạng vì dữ liệu video hoặc hình ảnh độ phân giải cao vẫn được giữ tại cục bộ.

Tuy nhiên, vẫn còn những thách thức, đặc biệt là liên quan đến sự không đồng nhất của hệ thống (các thiết bị khác nhau có năng lực xử lý khác nhau) và bảo mật chống lại adversarial attacks. Về lý thuyết, các client độc hại có thể gửi các bản cập nhật "độc hại" (poisoned) để làm hỏng global model. Để giảm thiểu điều này, các kỹ thuật tiên tiến như differential privacy thường được tích hợp để thêm nhiễu thống kê vào các bản cập nhật, đảm bảo không ai có thể truy ngược đóng góp của bất kỳ người dùng nào.

Các công cụ như Ultralytics Platform đang phát triển để giúp quản lý sự phức tạp của việc huấn luyện model trên các môi trường đa dạng, đảm bảo rằng tương lai của AI vừa mạnh mẽ vừa riêng tư. Các framework đổi mới như TensorFlow Federated và PySyft tiếp tục mở rộng ranh giới của những gì có thể thực hiện được với học máy phi tập trung bảo vệ quyền riêng tư.

Explore solutions

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Federated Learning

Link to this sectionQuy trình Federated hoạt động như thế nào#

Link to this sectionSo sánh Federated Learning với Distributed Training#

Link to this sectionCác ứng dụng trong thực tế#

Link to this sectionVí dụ mã nguồn: Mô phỏng cập nhật client cục bộ#

Link to this sectionƯu điểm và định hướng tương lai#

Explore solutions

AI trong ngành Robot

AI trong Logistics

AI trong ngành Bán lẻ

AI trong chăm sóc sức khỏe

AI trong sản xuất

AI trong Ô tô

AI trong Nông nghiệp

AI trong ngành Robot

AI trong Logistics

AI trong ngành Bán lẻ

AI trong chăm sóc sức khỏe

AI trong sản xuất

AI trong Ô tô

AI trong Nông nghiệp

AI trong ngành Robot

AI trong Logistics

AI trong ngành Bán lẻ

AI trong chăm sóc sức khỏe

AI trong sản xuất

AI trong Ô tô

AI trong Nông nghiệp

Hãy cùng nhau xây dựng tương lai của AI!