연합 학습을 알아보세요. 원시 데이터를 공유하지 않고도 분산된 장치에서 모델 학습을 가능하게 하는 개인 정보 보호 중심의 AI 접근 방식입니다.
연합 학습은 분산화된 접근 방식으로 머신 러닝(ML)에 대한 분산형 접근 방식으로 장치가 원래 소스에서 학습 데이터를 이동하지 않고도 공유 예측 모델을 공동으로 학습할 수 있는 분산형 접근 방식입니다. 데이터를 중앙 집중식 데이터 레이크 또는 클라우드 서버로 통합해야 하는 기존 방식과 달리 데이터 레이크 또는 클라우드 서버로 데이터를 집계해야 하는 기존 방법과 달리, 연합 학습은 모델을 데이터로 가져옵니다. 이러한 패러다임 전환은 다음과 같은 중요한 문제를 해결합니다. 데이터 개인 정보 보호 및 보안과 관련된 중요한 문제를 해결하여 스마트폰, IoT 센서, 병원 서버와 같은 로컬 디바이스에 민감한 사용자 정보를 엄격하게 보호하면서 강력한 시스템을 구축할 수 있습니다, 또는 병원 서버.
이 프로세스는 중앙 서버와 참여 클라이언트 장치 간의 반복적인 통신 주기에 의존합니다. 일반적으로 다음과 같은 뚜렷한 단계를 따릅니다:
연합 학습은 이론적 연구에서 데이터 민감성이 가장 중요한 산업에서 실제 배포로 실제 배포로 옮겨가고 있습니다.
두 개념 모두 다수의 머신을 포함하지만, 데이터 거버넌스와 네트워크 환경에서는 근본적으로 다릅니다.
페더레이션 설정에서 클라이언트의 역할은 로컬 데이터에 대한 글로벌 모델을 미세 조정하는 것입니다. 다음 Python 스니펫 은 클라이언트가 로컬 트레이닝의 한 라운드를 수행하는 방법을 보여줍니다. Ultralytics YOLO11 모델을 사용하여 한 라운드의 로컬 학습을 수행하는 방법을 보여줍니다. 추출하는 방법을 보여줍니다.
from ultralytics import YOLO
# Load the global model received from the central server
# In a real scenario, this 'yolo11n.pt' comes from the aggregator
model = YOLO("yolo11n.pt")
# Perform local training on the client's private dataset
# 'epochs=1' simulates a single round of local computation
results = model.train(data="coco8.yaml", epochs=1, imgsz=640)
# After training, the updated model weights are saved
# These weights are what the client sends back to the server
print("Local training complete. Update ready for transmission.")
연합 학습의 가장 큰 장점은 개인 정보 보호 설계입니다. 이를 통해 합성 데이터 또는 실제 개인 데이터를 사용할 수 있습니다. 법적 또는 윤리적 제한으로 인해 접근할 수 없는 합성 데이터나 실제 개인 데이터를 사용할 수 있습니다. 또한, 네트워크 대역폭 소비를 줄입니다. 대규모 데이터 세트가 전송되지 않기 때문입니다.
하지만 여전히 과제는 남아 있습니다. 시스템 이질성은 강력한 서버부터 배터리 제약이 있는 IoT 센서에 이르기까지 다양한 강력한 서버부터 배터리 제약이 있는 IoT 센서까지 다양한 컴퓨팅 성능을 갖춘 디바이스에서 실행해야 합니다. 또한 다음과 같은 위험도 있습니다. 적대적 공격악의적인 클라이언트가 포이즌 업데이트를 제출하여 글로벌 모델을 손상시킬 수 있습니다. 이를 완화하기 위해 연구자들은 차등 개인정보 보호 기술을 사용하여 업데이트에 노이즈를 추가하여 단일 사용자의 데이터를 리버스 엔지니어링할 수 없도록 합니다.
TensorFlow 페더레이티드와 PySyft와 같은 프레임워크는 현재 개발자가 이러한 복잡한 워크플로를 구현하는 데 도움을 주고 있습니다. 컴퓨터 비전이 계속 발전함에 따라 발전함에 따라 연합 학습은 사용자 프라이버시를 존중하는 동시에 고성능 결과를 제공하는 지능형 시스템을 배포하는 데 중요한 역할을 할 것입니다.

