TinyML
TinyML을 살펴보고 저전력 마이크로컨트롤러에 Ultralytics YOLO26을 배포하는 방법을 배우세요. 양자화와 Ultralytics Platform을 사용하여 IoT를 위한 모델 최적화 방법을 알아보세요.
Tiny machine learning(일반적으로 TinyML로 지칭됨)은 마이크로컨트롤러 및 소형 IoT 디바이스와 같이 리소스가 제한된 초저전력 디바이스에 모델을 배포하는 데 중점을 둔 머신 러닝의 전문화된 하위 분야입니다. 방대한 컴퓨팅 리소스에 의존하는 기존의 클라우드 기반 시스템과 달리, TinyML은 전적으로 에지(edge)에서 작동합니다. 밀리와트 단위의 전력 제한이 있는 디바이스에서 지능형 알고리즘을 로컬로 실행함으로써, 이 접근 방식은 대기 시간을 최소화하고 데이터 개인정보 보호를 보장하며 대역폭 사용량을 획기적으로 줄입니다. 이러한 패러다임은 TinyML Foundation과 같은 커뮤니티에 의해 지원 및 발전되고 있습니다.
복잡한 신경망 아키텍처를 ARM Cortex-M 프로세서와 같이 제약이 많은 하드웨어에 성공적으로 탑재하려면 모델이 엄격한 최적화를 거쳐야 합니다. 32비트 부동 소수점 가중치를 8비트 정수로 변환하는 모델 양자화 및 모델 가지치기와 같은 기술은 전반적인 메모리 점유율을 크게 줄이는 데 사용됩니다. 오늘날 Google의 TensorFlow Lite for Microcontrollers 및 PyTorch의 ExecuTorch와 같은 특수 프레임워크는 이러한 정밀한 압축 워크플로를 촉진하여 일상적인 임베디드 하드웨어에 고급 시각 및 청각 지능을 제공합니다.
Link to this sectionTinyML 대 Edge AI#
TinyML은 Edge AI와 밀접한 관련이 있지만, 주요 차이점은 하드웨어 규모와 전력 예산에 있습니다. Edge AI는 AI 모델의 로컬 실행을 포함하는 더 광범위한 용어이며, Raspberry Pi와 같은 싱글 보드 컴퓨터나 NVIDIA Jetson과 같은 강력한 임베디드 GPU를 사용하는 경우가 많습니다. 반면, TinyML은 Arduino 보드나 STMicroelectronics 칩과 같이 배터리로 수개월에서 수년간 작동하는 심층 임베디드 시스템을 구체적으로 대상으로 합니다. 이러한 디바이스는 일반적으로 수백 킬로바이트의 RAM만 보유하고 있어 공격적인 모델 압축이 필수적입니다.
Link to this section실제 애플리케이션 사례#
최소한의 하드웨어에 직접 지능을 배포할 수 있는 능력은 다양한 산업 분야에서 수많은 실제 활용 사례를 열었습니다.
- 스마트 제조 분야의 예측 정비: 공장에서는 초저전력 진동 및 오디오 센서를 기계에 직접 배치합니다. 이 TinyML 센서는 모터 주파수를 지속적으로 분석하여 고장을 암시하는 미세한 이상 징후를 감지함으로써, 유지보수 팀이 비용이 많이 드는 가동 중단이 발생하기 전에 문제를 해결할 수 있도록 합니다.
- 스마트 정밀 농업: 배터리로 작동하는 TinyML 디바이스를 광범위한 농지에 배치하여 국지적인 환경 조건을 모니터링하고, 기본 카메라 모듈을 사용하여 해충 침입이나 질병의 초기 징후를 감지합니다. 이때 무거운 이미지 파일 대신 가벼운 경고 알림만 전송합니다.
- 야생동물 보호 오디오 모니터링: 연구자들은 TinyML 기반의 숨겨진 음향 센서 어레이를 사용하여 밀림에서 멸종 위기 종의 특정 소리나 불법 벌목 활동(예: 전기톱 소리)을 감지합니다. 태양광이나 배터리로 작동하는 이 디바이스는 오디오를 로컬에서 분석하고 즉시 장거리 알림을 트리거합니다.
Link to this sectionTinyML을 위한 모델 내보내기#
Preparing a model for a microcontroller requires strict export formatting. Using Ultralytics YOLO26, developers can build robust object detection pipelines and compress them down for embedded targets. You can manage your dataset and model versioning seamlessly on the Ultralytics Platform before exporting locally. The native TFLite integration allows effortless conversion to the 8-bit integer formats required for microcontrollers, complementing other hardware-specific model deployment options like Apple's CoreML, Google's Edge TPU, and NVIDIA's TensorRT.
다음 예제는 TinyML 호환 에지 플랫폼에 배포하기 적합하도록 INT8 양자화로 특별히 최적화된 경량 YOLO26 모델을 내보내는 방법을 보여줍니다.
from ultralytics import YOLO
# Initialize the lightweight YOLO26 Nano model for edge use cases
model = YOLO("yolo26n.pt")
# Export to TFLite format with INT8 quantization and a reduced image size
# This minimizes the memory footprint and accelerates inference on microcontrollers
model.export(format="tflite", int8=True, imgsz=160)





