Yolo 비전 선전
선전
지금 참여하기
용어집

연합 학습

연합 학습을 알아보세요. 원시 데이터를 공유하지 않고도 분산된 장치에서 모델 학습을 가능하게 하는 개인 정보 보호 중심의 AI 접근 방식입니다.

연합 학습은 분산화된 접근 방식으로 머신 러닝(ML)에 대한 분산형 접근 방식으로 장치가 원래 소스에서 학습 데이터를 이동하지 않고도 공유 예측 모델을 공동으로 학습할 수 있는 분산형 접근 방식입니다. 데이터를 중앙 집중식 데이터 레이크 또는 클라우드 서버로 통합해야 하는 기존 방식과 달리 데이터 레이크 또는 클라우드 서버로 데이터를 집계해야 하는 기존 방법과 달리, 연합 학습은 모델을 데이터로 가져옵니다. 이러한 패러다임 전환은 다음과 같은 중요한 문제를 해결합니다. 데이터 개인 정보 보호 및 보안과 관련된 중요한 문제를 해결하여 스마트폰, IoT 센서, 병원 서버와 같은 로컬 디바이스에 민감한 사용자 정보를 엄격하게 보호하면서 강력한 시스템을 구축할 수 있습니다, 또는 병원 서버.

Federated Learning은 어떻게 작동하나요?

이 프로세스는 중앙 서버와 참여 클라이언트 장치 간의 반복적인 통신 주기에 의존합니다. 일반적으로 다음과 같은 뚜렷한 단계를 따릅니다:

  1. 초기화: 중앙 서버가 글로벌 신경망 모델을 초기화하고 이를 적격 클라이언트 디바이스의 적격 클라이언트 디바이스 그룹에 브로드캐스트합니다.
  2. 로컬 교육: 각 클라이언트 디바이스는 자체 개인 데이터를 사용하여 모델 학습을 로컬에서 수행합니다. 이 엣지 AI 기능을 활용하여 원시 데이터가 디바이스 외부로 절대로 디바이스를 떠나지 않습니다.
  3. 업데이트 전송: 클라이언트는 데이터를 공유하는 대신 수학적 모델, 즉 그라데이션이나 기울기 등 업데이트, 특히 그라데이션이나 모델 가중치 등수학적 모델업데이트만 중앙 서버로 전송합니다.
  4. 집계: 서버는 다음과 같은 기술을 사용합니다. 연합 평균(FedAvg)과 같은 기술을 사용하여 이러한 업데이트를 새로운 새로운 글로벌 모델로 결합합니다.
  5. 반복: 업데이트된 글로벌 모델이 클라이언트로 다시 전송되고, 모델이 원하는 정확도에 도달할 때까지 이 주기가 반복됩니다. 이 원하는 정확도에 도달할 때까지 반복됩니다.

실제 애플리케이션

연합 학습은 이론적 연구에서 데이터 민감성이 가장 중요한 산업에서 실제 배포로 실제 배포로 옮겨가고 있습니다.

  • 의료 및 의료 영상: 병원은 연합 학습을 사용하여 다음과 같이 협업합니다. 종양 탐지를 위한 의료 영상 분석 종양 발견을 위한 의료 이미지 분석에 연합 학습을 사용합니다. 이를 통해 기관은 다양한 데이터에 대해 강력한 다양한 데이터 세트에 대한 의료 솔루션의 강력한 AI를 학습시키면서 다양한 데이터 세트에서 강력한 AI를 학습시킬 수 있습니다.
  • 모바일 예측 텍스트: 스마트폰 키보드는 이 기술을 활용하여 향상된 자연어 처리(NLP) 모델을 개선하기 위해 이 기술을 활용합니다. 이 시스템은 타이핑 패턴을 로컬에서 학습함으로써 개인 문자 메시지를 클라우드로 전송하지 않고도 개인 문자 메시지를 클라우드로 전송하지 않고도 사용자 경험을 개선합니다. Google AI 연구.

연합 학습 대 분산 교육

두 개념 모두 다수의 머신을 포함하지만, 데이터 거버넌스와 네트워크 환경에서는 근본적으로 다릅니다.

  • 연합 학습: 데이터는 로컬에서 생성되며 개인정보 보호 제약으로 인해 분산된 상태로 유지됩니다. 디바이스는 종종 이기종(서로 다른 하드웨어)이며 네트워크 연결이 불안정합니다.
  • 분산 교육: 일반적으로 중앙 데이터 세트가 컴퓨팅 노드( GPU 클러스터와 같이) 대규모 데이터 세트의 처리 속도를 높이기 위해 대규모 데이터 세트의 처리 속도를 높이기 위해

코드 예제: 로컬 클라이언트 업데이트 시뮬레이션

페더레이션 설정에서 클라이언트의 역할은 로컬 데이터에 대한 글로벌 모델을 미세 조정하는 것입니다. 다음 Python 스니펫 은 클라이언트가 로컬 트레이닝의 한 라운드를 수행하는 방법을 보여줍니다. Ultralytics YOLO11 모델을 사용하여 한 라운드의 로컬 학습을 수행하는 방법을 보여줍니다. 추출하는 방법을 보여줍니다.

from ultralytics import YOLO

# Load the global model received from the central server
# In a real scenario, this 'yolo11n.pt' comes from the aggregator
model = YOLO("yolo11n.pt")

# Perform local training on the client's private dataset
# 'epochs=1' simulates a single round of local computation
results = model.train(data="coco8.yaml", epochs=1, imgsz=640)

# After training, the updated model weights are saved
# These weights are what the client sends back to the server
print("Local training complete. Update ready for transmission.")

장점과 과제

연합 학습의 가장 큰 장점은 개인 정보 보호 설계입니다. 이를 통해 합성 데이터 또는 실제 개인 데이터를 사용할 수 있습니다. 법적 또는 윤리적 제한으로 인해 접근할 수 없는 합성 데이터나 실제 개인 데이터를 사용할 수 있습니다. 또한, 네트워크 대역폭 소비를 줄입니다. 대규모 데이터 세트가 전송되지 않기 때문입니다.

하지만 여전히 과제는 남아 있습니다. 시스템 이질성은 강력한 서버부터 배터리 제약이 있는 IoT 센서에 이르기까지 다양한 강력한 서버부터 배터리 제약이 있는 IoT 센서까지 다양한 컴퓨팅 성능을 갖춘 디바이스에서 실행해야 합니다. 또한 다음과 같은 위험도 있습니다. 적대적 공격악의적인 클라이언트가 포이즌 업데이트를 제출하여 글로벌 모델을 손상시킬 수 있습니다. 이를 완화하기 위해 연구자들은 차등 개인정보 보호 기술을 사용하여 업데이트에 노이즈를 추가하여 단일 사용자의 데이터를 리버스 엔지니어링할 수 없도록 합니다.

TensorFlow 페더레이티드와 PySyft와 같은 프레임워크는 현재 개발자가 이러한 복잡한 워크플로를 구현하는 데 도움을 주고 있습니다. 컴퓨터 비전이 계속 발전함에 따라 발전함에 따라 연합 학습은 사용자 프라이버시를 존중하는 동시에 고성능 결과를 제공하는 지능형 시스템을 배포하는 데 중요한 역할을 할 것입니다.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기