엣지 AI가 어떻게 디바이스에서 안전하고 효율적인 실시간 AI 처리를 지원하여 의료 및 자율 주행 차량과 같은 산업을 혁신하는지 알아보세요.
엣지 AI는 스마트폰, 카메라, 센서, 임베디드 시스템 등 엣지 디바이스라고 하는 로컬 하드웨어 장치에서 직접 인공지능(AI) 알고리즘을 실행하는 방식을 말합니다. 엣지 AI는 데이터를 원격 클라우드 컴퓨팅 서버로 전송하여 처리하는 대신 데이터가 생성된 소스에서 더 가까운 곳에서 데이터 분석 및 의사 결정을 내릴 수 있도록 지원합니다. 이 접근 방식은 특수 AI 칩과 같은 하드웨어의 발전과 효율적인 머신 러닝(ML) 모델을 활용하여 네트워크의 엣지에 인텔리전스를 제공합니다. 이를 통해 디바이스는 이미지 인식, 자연어 처리(NLP), 이상 징후 탐지와 같은 작업을 로컬에서 수행할 수 있습니다.
이 과정에는 일반적으로 강력한 클라우드 리소스나 로컬 서버를 사용하여 AI 모델을 학습시키는 작업이 포함됩니다. 학습이 완료된 모델은 모델 정량화 또는 모델 가지치기와 같은 최적화 기술을 거쳐 크기와 계산 요구 사항을 줄입니다. 이러한 최적화는 리소스가 제한된 에지 디바이스에서 모델을 효율적으로 실행하는 데 매우 중요한데, 이는 종종 처리 능력이 제한적인(CPU/GPU), 메모리, 배터리 수명이 제한적인 에지 디바이스에서 모델을 효율적으로 실행하는 데 중요합니다. 그런 다음 최적화된 모델은 TensorFlow Lite, PyTorch Mobile, ONNX Runtime과 같은 프레임워크 또는 Intel OpenVINO 같은 특수 SDK를 사용하여 엣지 디바이스에 배포됩니다. 그러면 디바이스는 로컬 센서(예: 카메라, 마이크)를 사용하여 실시간 추론을 수행하여 지속적인 인터넷 연결 없이도 데이터를 처리하고 인사이트 또는 조치를 생성할 수 있습니다. 이러한 배포를 관리하는 것은 Ultralytics HUB와 같은 플랫폼을 사용하여 간소화할 수 있습니다.
가장 큰 차이점은 AI 연산이 이루어지는 위치에 있습니다. 클라우드 AI는 중앙 집중식 서버에서 데이터를 처리하여 복잡한 모델과 대규모 학습 데이터에 적합한 방대한 연산 리소스를 제공합니다. 하지만 데이터 전송으로 인한 지연 시간이 발생하고 안정적인 인터넷 연결이 필요합니다. 반면 엣지 AI는 디바이스에서 로컬로 데이터를 처리합니다. 따라서 지연 시간을 최소화하고 민감한 정보가 디바이스를 떠날 필요가 없어 데이터 프라이버시를 강화하며 오프라인 또는 저대역폭 환경에서도 작동할 수 있습니다. 단점은 엣지 디바이스의 리소스가 제한되어 있어 배포 가능한 모델의 복잡성이 제한된다는 점입니다. 엣지 AI와 클라우드 AI에 대해 자세히 알아보세요.
엣지 AI는 광범위한 엣지 컴퓨팅 분야 내의 특정 애플리케이션입니다. 엣지 컴퓨팅은 컴퓨팅 작업을 중앙 집중식 데이터 센터에서 사용자 및 데이터 소스에 더 가까운 네트워크의 '엣지'로 옮기는 일반적인 패러다임을 말합니다. 엣지 AI는 특히 이 개념을 AI 및 ML 워크로드에 적용하여 엣지 디바이스에서 직접 지능적인 처리를 가능하게 합니다. 엣지 컴퓨팅에는 다양한 유형의 처리가 포함될 수 있지만, 엣지 AI는 AI 모델을 로컬로 배포하고 실행하는 데 중점을 둡니다. 여기에서 엣지 컴퓨팅에 대해 자세히 알아볼 수 있습니다.
엣지 AI는 특히 컴퓨터 비전(CV) 분야에서 수많은 산업을 혁신하고 있습니다. 증가하는 수요는 증가하는 에지 AI 시장 규모에 반영되어 있습니다.
이러한 장점에도 불구하고 엣지 AI는 엣지 디바이스의 제한된 컴퓨팅 리소스(컴퓨팅 성능 영향), 고도로 최적화된 모델(예: YOLOv9의 효율성), 수많은 분산 디바이스에서 모델 배포 및 업데이트 관리(주로 Docker 같은 도구 사용), 다양한 실제 조건에서 모델 성능 보장 등의 과제에 직면해 있습니다. Google Edge TPU 같은 특수 하드웨어와 소니 IMX500과 같은 센서는 이러한 하드웨어의 일부 제한 사항을 해결하는 데 도움이 됩니다. 다음과 같은 프레임워크 NVIDIA TensorRT 와 같은 프레임워크도 최적화에 도움이 됩니다.
엣지 AI는 인텔리전스를 중앙 집중식 클라우드에서 로컬 디바이스로 이동시켜 AI 기능 제공 방식에 중대한 변화를 가져옵니다. 이를 통해 네트워크의 엣지에서 효과적으로 작동하여 소비자 가전부터 중요한 산업 시스템에 이르기까지 모든 것에 영향을 미칠 수 있는 차세대 반응성, 프라이빗, 안정성을 갖춘 AI 애플리케이션을 구현할 수 있습니다.