AI 기반 행동 분석과 동물 농장과 같은 분야에서 실제 응용 분야에 대한 David Scott의 YOLO Vision 2024 기조 연설을 다시 살펴봅니다.
%25202.webp)
AI 기반 행동 분석과 동물 농장과 같은 분야에서 실제 응용 분야에 대한 David Scott의 YOLO Vision 2024 기조 연설을 다시 살펴봅니다.
수년 동안 컴퓨터 비전 혁신은 객체 감지와 같은 작업, 즉 이미지와 비디오에서 개나 자동차와 같은 객체를 식별하는 데 중점을 두었습니다. 이러한 접근 방식은 자율 주행 차량, 제조 및 의료와 같은 분야에서 응용 프로그램을 가능하게 했습니다.
그러나 이러한 작업은 종종 객체가 무엇인지 식별하는 데만 중점을 둡니다. Vision AI 시스템이 한 단계 더 나아갈 수 있다면 어떨까요? 예를 들어, 단순히 개를 감지하는 대신 개가 공을 쫓고 있다거나 보행자가 횡단보도를 건너고 있기 때문에 차가 갑자기 브레이크를 밟고 있다는 것을 이해할 수 있다고 가정해 보겠습니다. 기본적인 인식에서 상황 인식 이해로의 이러한 전환은 더 스마트하고 상황을 인식하는 행동 AI로의 중요한 전환을 나타냅니다.
Vision AI의 발전을 기념하는 Ultralytics의 연례 하이브리드 이벤트인 YOLO Vision 2024(YV24)에서 The Main Branch의 CEO인 David Scott의 흥미로운 강연을 통해 AI 기반 행동 분석이라는 개념이 중심 무대를 차지했습니다.
그의 강연에서 David는 기본적인 컴퓨터 비전 작업에서 행동 추적으로의 전환을 탐구했습니다. 최첨단 기술 애플리케이션 구축에 25년 이상의 경험을 바탕으로 그는 이러한 도약의 영향을 보여주었습니다. 그는 패턴과 행동을 해독하는 것이 농업 및 동물 복지와 같은 산업을 어떻게 재편하고 있는지 강조했습니다.
본 문서에서는 David의 강연의 주요 내용을 살펴보고 행동 추적이 AI를 어떻게 더 실용적으로 만드는지 알아봅니다.
David Scott은 기조 연설을 대담한 현실 점검으로 시작하며 다음과 같이 말했습니다. "제 동료 중 한 명이 종종 '과학은 팔리지 않는다'라고 말하는데, 이는 우리 중 많은 사람들을 불쾌하게 합니다. 왜냐하면 우리는 과학을 정말 좋아하기 때문입니다. AI는 정말 멋진데 왜 사람들이 그냥 사지 않을까요? 하지만 현실은 사람들이 우리가 멋지다고 생각하기 때문에 그것을 사고 싶어하는 것이 아니라, 그들이 그것을 사야 할 이유가 필요합니다."
그는 자신의 회사인 The Main Branch에서는 AI의 기능을 과시하는 것이 아니라 실제 문제를 해결하는 데 항상 초점을 맞추고 있다고 설명했습니다. 많은 고객들이 AI를 어떻게 활용할 수 있는지에 대해 이야기하고 싶어 하지만, 그는 그것을 문제 없이 해결책을 찾는 것과 같은 뒤바뀐 접근 방식이라고 생각합니다. 대신, 그들은 구체적인 문제를 제기하는 고객과 협력하여 실제로 변화를 가져오는 AI 솔루션을 만들 수 있습니다.
David는 또한 그들의 작업이 종종 장면에서 객체를 인식하는 것 이상으로 확장된다고 밝혔습니다. 거기에 무엇이 있는지 발견하는 것은 단지 첫 번째 단계일 뿐입니다. 진정한 가치는 그 정보를 가지고 무엇을 할지 파악하고 더 큰 가치 사슬 내에서 유용하게 만드는 데서 나옵니다.
AI를 진정으로 유용하게 만드는 데 있어 중요한 단계는 객체 감지와 같은 기본적인 컴퓨터 비전 작업을 넘어 이러한 통찰력을 행동 추적에 사용하는 것입니다. David는 행동 AI는 단순히 객체를 식별하는 것이 아니라 행동과 패턴을 이해하는 데 초점을 맞춘다고 강조했습니다. 이를 통해 AI는 의미 있는 이벤트를 인식하고 실행 가능한 통찰력을 제공할 수 있습니다.
그는 바닥에서 구르는 동물의 예를 들었는데, 이는 질병을 나타낼 수 있습니다. 사람들은 동물을 24시간 내내 지켜볼 수 없지만 행동 추적 기능이 있는 AI 기반 감시 시스템은 가능합니다. 이러한 솔루션은 물체를 지속적으로 모니터링하고 특정 행동을 감지하고 경고를 보내 적시에 조치를 취할 수 있도록 합니다. 이는 원시 데이터를 실용적이고 가치 있는 것으로 바꿉니다.
David는 또한 이러한 접근 방식이 AI를 흥미로울 뿐만 아니라 진정으로 영향력 있게 만든다는 것을 보여주었습니다. 행동을 모니터링하고 그에 따라 행동하는 것과 같은 실제 문제를 해결함으로써 행동 추적은 다양한 산업 분야에서 효과적인 AI 솔루션의 핵심 부분이 될 수 있습니다.
David Scott은 이어서 컴퓨터 비전 모델인 Ultralytics YOLOv8이 그의 팀의 행동 추적 프로젝트에 어떻게 획기적인 발전을 가져왔는지 설명했습니다. 그것은 그들에게 객체를 감지, 분류 및 추적하기 위한 견고한 기반을 제공했습니다. 그의 팀은 또한 한 단계 더 나아가 시간 경과에 따른 행동 모니터링에 집중하도록 YOLOv8을 맞춤형으로 훈련하여 실제 상황에서 더욱 실용적이고 유용하게 만들었습니다.
흥미롭게도, Ultralytics YOLO11 출시와 함께 The Main Branch에서 만든 솔루션과 같은 것들이 훨씬 더 안정적이고 정확해질 수 있습니다. 이 최신 모델은 행동 추적 능력을 향상시키는 개선된 정밀도 및 더 빠른 처리와 같은 기능을 제공합니다. 행동 AI가 사용될 수 있는 애플리케이션에 대한 더 나은 이해를 얻은 후 이에 대해 더 자세히 논의할 것입니다.
다음으로 David가 이야기한 솔루션과 행동 추적 기술이 일상적인 문제를 해결하고 의미 있는 영향을 미치기 위해 실제 애플리케이션에서 어떻게 사용되고 있는지 살펴보겠습니다.
먼저 David는 HerdSense라는 프로젝트를 통해 해결한 흥미로운 과제를 공유했습니다. 이 프로젝트는 대규모 사육장에서 수천 마리의 소의 건강을 모니터링하는 것과 관련이 있었습니다. 목표는 잠재적인 건강 문제를 식별하기 위해 개별 소의 행동을 추적하는 것이었습니다. 이는 동시에 수만 마리의 동물을 주시해야 함을 의미했으며 간단한 작업이 아니었습니다.
각 소를 식별하고 그 행동을 추적하는 문제를 해결하기 시작하기 위해 David의 팀은 모니터링해야 할 모든 가능한 행동을 개략적으로 설명하기 위해 2일간의 워크숍을 실시했습니다. 그들은 총 200개 이상의 행동을 식별했습니다.
200가지 행동 각각은 모든 데이터를 특정 동물과 연결해야 했기 때문에 개별 소를 정확하게 인식할 수 있는지에 달려 있었습니다. 주요 관심사 중 하나는 소들이 함께 모여 웅크리고 있을 때 개별 동물을 보기 어렵게 만드는 것이었습니다.
David의 팀은 각 소를 까다로운 상황에서도 일관되게 식별할 수 있도록 컴퓨터 비전 시스템을 개발했습니다. 그들은 같은 소가 시야에서 사라지거나, 다른 소들과 섞이거나, 나중에 다시 나타나더라도 항상 동일한 ID가 할당되는 것을 확인할 수 있었습니다.
다음으로 David는 말을 모니터링하기 위해 유사한 행동 추적 기술을 적용한 또 다른 흥미로운 프로젝트를 소개했습니다. 이 프로젝트에서 David의 팀은 소에서 했던 것처럼 개별 말 ID를 면밀히 추적할 필요가 없었습니다. 대신 특정 행동에 초점을 맞추고 섭취 패턴 및 일반적인 활동 수준과 같은 세부 정보를 추적하여 건강 문제를 조기에 발견했습니다. 행동의 작은 변화를 식별하면 더 나은 관리를 제공하고 문제가 심각해지기 전에 예방하기 위해 더 빠른 개입으로 이어질 수 있습니다.
David는 또한 흥미로운 예시를 통해 행동 추적의 복잡성에 대해 논의했습니다. 행동 분석 개선 방법을 연구하던 중, 그의 팀은 특정 자세, 예를 들어 주머니에 손을 넣고 있는 사람을 분석하여 도둑질을 감지한다고 주장하는 회사를 발견했습니다. 처음에는 이것이 스마트한 아이디어처럼 보였습니다. 특정 움직임이 의심스러운 행동을 암시할 수 있기 때문입니다.
그러나 데이비드는 더 탐구하면서 이 방법의 한계를 깨달았습니다. 주머니에 손을 넣는 것과 같은 단일 자세가 반드시 누군가가 가게에서 물건을 훔치고 있다는 것을 의미하지는 않습니다. 단지 편안하거나 생각에 잠겨 있거나 심지어 추울 수도 있습니다. 고립된 자세에 초점을 맞추는 것의 문제점은 더 큰 맥락을 무시한다는 것입니다. 행동은 단순한 단일 행동이 아니라 시간 경과에 따른 행동 패턴이며, 맥락과 의도에 따라 형성됩니다.
David는 진정한 행동 추적은 훨씬 더 복잡하며 전체적인 접근 방식이 필요하다고 강조했습니다. 그것은 일련의 행동을 분석하고 더 넓은 그림에서 그 의미를 이해하는 것에 관한 것입니다. AI 산업이 발전을 거듭하고 있지만, 의미 있고 정확한 통찰력을 제공하기 위해 행동 추적을 발전시키는 데에는 여전히 해야 할 일이 많다고 그는 언급했습니다.
이어서 David은 YOLOv8과 그 자세 추정 기능을 활용하여 소의 건강을 모니터링하는 컴퓨터 비전 솔루션을 팀이 어떻게 구축했는지 청중들에게 보여주었습니다.
그들은 먼저 소의 자세 추정을 위한 맞춤형 데이터 세트를 만들어 키포인트의 표준 수를 17개에서 145개로 늘려 모델이 움직임을 더 잘 분석하도록 했습니다. 그런 다음 모델은 2백만 개 이상의 이미지와 1억 1천만 개의 행동 예제로 구성된 대규모 데이터 세트에서 훈련되었습니다.
David의 팀은 고급 하드웨어 인프라를 사용하여 기존 하드웨어에서 몇 주가 걸렸을 모델 훈련을 단 이틀 만에 완료할 수 있었습니다. 그런 다음 훈련된 모델을 여러 비디오 프레임을 동시에 분석하여 소의 행동 패턴을 감지하는 사용자 지정 행동 추적기와 통합했습니다.
그 결과, 건강 문제를 나타낼 수 있는 사소한 행동 변화를 감지하기 위해 먹기, 마시기, 눕기와 같은 8가지 다른 소 행동을 감지하고 추적할 수 있는 비전 AI 기반 솔루션이 탄생했습니다. 이를 통해 농부들은 신속하게 대처하고 가축 관리를 개선할 수 있습니다.
David는 강연을 마무리하면서 청중에게 중요한 교훈을 전달했습니다. "AI에게 실패할 여지를 주지 않으면 결국 실패하게 됩니다. AI는 통계에 기반하기 때문입니다." 그는 AI가 강점을 가지고 있지만 완벽하지 않다는 점을 지적했습니다. AI는 패턴을 학습하는 도구이므로 제대로 작동하지 않는 경우가 항상 발생합니다. 이러한 실수를 두려워하는 대신, 실수를 처리하고 시간이 지남에 따라 계속 개선할 수 있는 시스템을 구축하는 것이 중요합니다.
이는 컴퓨터 비전 모델 자체에도 해당됩니다. 예를 들어, Ultralytics YOLO 모델의 최신 버전인 Ultralytics YOLO11은 YOLOv8에 비해 한 단계 더 발전해야 한다는 점을 염두에 두고 구축되었습니다.
특히 YOLO11은 특히 농업 및 의료와 같이 정밀도가 중요한 실시간 애플리케이션과 관련하여 더 나은 성능을 제공합니다. 고급 기능을 갖춘 YOLO11은 혁신적인 실시간 통찰력을 제공하고 과제를 보다 효과적으로 해결하도록 지원함으로써 산업에서 AI를 사용하는 방식을 재정의하고 있습니다.
YV24에서 David의 기조 연설은 AI가 단순한 멋진 혁신 그 이상이며, 실제 문제를 해결하고 우리가 살고 일하는 방식을 개선하는 강력한 도구라는 점을 상기시켜 주었습니다. 행동에 초점을 맞춤으로써 AI는 이미 동물 건강 추적, 일상적인 행동에서 의미 있는 패턴 인식과 같은 분야에서 영향을 미치고 있습니다.
행동 AI의 잠재력은 매우 크며, 아직 초기 단계에 불과합니다. 원시 데이터를 실행 가능한 통찰력으로 전환함으로써 행동 AI는 수동적인 모니터링에서 능동적인 문제 해결로 전환됩니다. 행동 AI는 앞으로 더욱 발전하여 더 스마트한 의사 결정, 간소화된 프로세스, 그리고 우리 삶에 의미 있는 개선을 가져올 것입니다.
AI 및 실제 응용 분야에 대해 자세히 알아보려면 커뮤니티와 계속 소통하세요. GitHub 저장소를 방문하여 농업 분야의 AI 및 제조 분야의 컴퓨터 비전과 같은 분야의 혁신을 확인하세요.