욜로 비전 선전
선전
지금 참여하기
고객 성공 사례로 돌아가기

Prezent, 슬라이드 요소를 감지하기 위해 Ultralytics YOLO 모델 사용

문제

Prezent는 기존 도구가 느리고 신뢰할 수 없으며 디자인을 제대로 유지하지 못하는 경우가 많았기 때문에 슬라이드 구조를 자동으로 감지할 수 있는 Vision AI 솔루션이 필요했습니다.

솔루션

Ultralytics YOLO 모델을 통해 Prezent는 정확도를 65%에서 87%로 향상시키고, 훈련 시간을 3일에서 1일로 단축했으며, 슬라이드 처리 시간을 10초 이내로 줄였습니다.

프레젠테이션은 비즈니스 회의에서 명확한 커뮤니케이션을 위한 핵심이지만, 영향력 있고 유익하도록 재설계하는 것은 어려울 수 있습니다. Prezent는 AI를 사용하여 제목, 텍스트, 이미지 및 차트와 같은 슬라이드 요소를 감지하고 이해하여 재설계된 슬라이드가 명확하고 시각적으로 매력적이며 따라하기 쉬운지 확인합니다.

Prezent는 슬라이드 요소 감지를 위한 다양한 도구를 테스트하면서 많은 도구가 레이아웃과 정보 계층 구조를 붕괴시켜 프레젠테이션의 응집력을 떨어뜨린다는 것을 발견했습니다. Ultralytics YOLO 모델을 통합함으로써 Prezent는 프로세스를 간소화하여 최소한의 노력으로 슬라이드 요소 감지를 더 빠르고 부드럽고 전문적으로 만듭니다.

AI를 사용하여 슬라이드 재설계를 더 빠르고 스마트하게 만들기

Prezent는 C-suite 임원진과 비즈니스 팀이 재설계 프로세스를 자동화하여 명확하고 전문적인 프레젠테이션을 만들 수 있도록 지원합니다. 원래는 수동 템플릿과 인적 노력에 의존하여 속도가 느리고 비효율적이었습니다. 

효율성을 높이기 위해 Prezent는 AI와 컴퓨터 비전을 활용하여 원본 레이아웃을 유지하면서 슬라이드 서식 지정을 자동화했습니다. 객체 감지 모델을 사용하여 플랫폼은 이제 최소한의 사용자 입력으로 더 빠르고 원활한 재설계 프로세스를 위해 슬라이드 콘텐츠를 자동으로 감지하고 구성할 수 있습니다. 이를 통해 Prezent는 프레젠테이션이 명확하고 시각적으로 매력적이며 따라하기 쉬운지 확인합니다.

AI 기반 슬라이드 재설계의 어려움

훌륭한 프레젠테이션은 단순히 정보를 전달하는 것을 넘어 명확성, 구조, 그리고 임팩트가 중요합니다. 하지만 슬라이드를 더 매력적으로 만들기 위해 수동으로 재설계하는 것은 시간과 노력이 많이 소요됩니다. 특히 회의에서 프레젠테이션에 자주 의존하는 C-suite 임원진과 비즈니스 팀에게는 느리고 답답한 재설계 과정이 큰 어려움이었습니다.

Prezent는 슬라이드 재설계를 자동화하기 시작했지만, 중요한 장애물이 있었습니다. 모든 요소를 제자리에 유지하면서 슬라이드 요소를 감지하고 재구성하는 방법은 무엇일까요? 기존 도구는 텍스트를 추출할 수 있었지만 제목, 이미지, 차트가 어떻게 배열되었는지 인식하지 못하여 레이아웃을 손상시키는 경우가 많았습니다.

처음에 Prezent는 오픈 소스 객체 탐지 모델을 사용했지만, 이러한 방법에는 낮은 정확도(60-65%), 느린 처리 시간, 여전히 수동 수정이 필요한 레이아웃과 같은 제한 사항이 있었습니다. 프로세스를 진정으로 자동화하기 위해 Prezent는 구조를 손상시키지 않으면서 슬라이드 요소를 정확하게 감지하고 재설계할 수 있는 더 빠르고 스마트한 Vision AI 솔루션이 필요했습니다. 그래서 그들은 컴퓨터 비전과 AI를 사용하여 프로세스를 원활하게 만들었습니다.

슬라이드 요소 감지를 위한 Prezent의 Vision AI 솔루션

레이아웃을 그대로 유지하면서 슬라이드 재설계를 자동화하기 위해 Prezent는 Ultralytics YOLO 모델을 플랫폼에 통합했습니다. Ultralytics YOLO 모델은 객체 감지를 포함한 다양한 컴퓨터 비전 작업을 지원합니다. 슬라이드는 이미지로 변환되고 YOLO는 제목, 텍스트 상자, 이미지 및 차트와 같은 주요 요소를 감지하면서 원래 레이아웃을 그대로 유지합니다. 

YOLO는 레이아웃 추출에서 중요한 역할을 수행하며, Prezent가 각 슬라이드의 구조와 계층을 유지하면서 빠르고 자동화된 재설계를 가능하게 합니다. YOLO는 텍스트와 시각적 요소를 모두 인식하여 프레젠테이션이 기능과 세련된 디자인을 모두 유지하도록 돕습니다. 높은 정확도와 빠른 처리 속도를 갖춘 YOLO는 Prezent가 슬라이드 요소 감지를 자동화하여 수동 조정을 줄일 수 있도록 지원합니다.

Ultralytics YOLO 모델을 선택하는 이유

Prezent는 Ultralytics YOLO 모델이 다른 Vision AI 모델에 비해 더 빠르게 학습되고, 정확도가 높으며, 지연 시간이 짧기 때문에 선택했습니다. Prezent는 대부분의 모델이 학습하는 데 2~3일이 걸려 반복 작업과 개선 속도가 느려진다는 것을 발견했습니다. 

Prezent의 수석 데이터 과학자는 "일반적으로 머신 러닝 모델을 훈련하는 데 엄청난 시간이 소요되며, 추론 후 정확도가 충분한지 판단하기 위해 2~3일을 기다려야 하는 경우가 많습니다. 하지만 YOLO를 사용하면 단 하루 만에 모델을 훈련하고, 신속하게 의사 결정을 내리고, 결과를 통해 빠르게 학습할 수 있습니다."라고 말합니다.

YOLO를 통해 Prezent의 정확도는 65%에서 87%로 증가했으며 모델을 빠르게 개선하고 성능을 향상시킬 수 있었습니다. 또한 YOLO의 빠른 추론 속도는 10초 이내에 슬라이드 처리를 가능하게 하여 실시간 자동화와 원활한 사용자 경험을 보장합니다. YOLO를 통합함으로써 Prezent는 효율적이고 정확한 슬라이드 재설계를 위한 안정적이고 확장 가능한 솔루션을 찾았습니다.

YOLO로 10초 이내에 슬라이드 처리

Ultralytics YOLO 모델을 활용하여 Prezent는 슬라이드 재설계 프로세스를 더 빠르고 효율적이며 정확하게 재정의했습니다. 슬라이드 요소를 자동으로 감지하고 구성하는 기능을 통해 프레젠테이션은 수동 개입 없이 원래 구조, 명확성 및 시각적 매력을 유지할 수 있었습니다.

Prezent의 수석 데이터 과학자는 "Ultralytics YOLO를 사용하면 처리 속도도 뛰어나 고객에게 완전히 처리된 슬라이드를 10초 이내에 제공할 수 있습니다. 빠른 훈련 시간과 짧은 지연 시간은 워크플로우를 간소화하고 재설계 품질을 개선하는 데 핵심적인 역할을 했습니다."라고 밝혔습니다.

YOLO의 실시간 처리 능력을 통해 Prezent는 슬라이드 레이아웃 감지를 완전 자동화하여 수동 재설계의 비효율성을 제거할 수 있었습니다. C-suite 임원진과 비즈니스 팀은 세련되고 전문적인 프레젠테이션을 즉시 생성하여 워크플로 효율성과 사용자 경험을 향상시킬 수 있습니다. 컴퓨터 비전과 AI를 통합함으로써 Prezent는 생산성과 프레젠테이션 품질을 모두 향상시키는 확장 가능하고 자동화된 솔루션을 구축했습니다.

문서 분석에서 컴퓨터 비전의 미래

Prezent는 컴퓨터 비전 모델이 더 복잡한 레이아웃을 처리하고 문서 구조에 대한 더 심층적인 통찰력을 제공하는 능력이 향상되기를 바랍니다. 이를 통해 더욱 세련되고 정확한 슬라이드 재설계가 가능해질 것입니다.

잠재적인 개선 사항 중 하나는 관련 요소를 하위 범주로 그룹화하는 기능입니다. 이러한 통찰력은 Vision AI 모델이 슬라이드 구성 요소 간의 계층 구조와 관계를 이해하는 데 도움이 됩니다. 결과적으로 재설계된 슬라이드는 더 나은 구조화, 시각적 응집력 및 따라하기 쉬운 슬라이드가 될 것입니다.

전반적으로 Prezent는 자동화 및 AI 기반 솔루션에 대한 수요가 증가함에 따라 컴퓨터 비전 모델이 더욱 복잡한 작업을 더 높은 정확도와 속도로 처리할 수 있도록 계속 발전할 것이라고 믿습니다. 

비전 AI가 어떻게 비즈니스를 개선할 수 있는지 궁금하신가요? GitHub 저장소를 방문하여 헬스케어 분야의 컴퓨터 비전제조업과 같은 다양한 산업 분야에 대한 Ultralytics의 AI 솔루션을 확인하세요. YOLO 모델 및 라이선스 옵션이 어떻게 시작하는 데 도움이 되는지 알아보세요!

귀사 산업을 위한 솔루션

모두 보기

자주 묻는 질문

Ultralytics YOLO 모델이란 무엇입니까?

Ultralytics YOLO 모델은 이미지 및 비디오 입력에서 시각적 데이터를 분석하기 위해 개발된 컴퓨터 비전 아키텍처입니다. 이러한 모델은 객체 감지, 분류, 자세 추정, 추적 및 인스턴스 분할을 포함한 작업에 대해 학습될 수 있습니다. Ultralytics YOLO 모델에는 다음이 포함됩니다.

  • Ultralytics YOLOv5
  • Ultralytics YOLOv8
  • Ultralytics YOLO11

Ultralytics YOLO 모델 간의 차이점은 무엇인가요?

Ultralytics YOLO11은 최신 버전의 컴퓨터 비전 모델입니다. 이전 버전과 마찬가지로 Vision AI 커뮤니티가 YOLOv8에서 선호하는 모든 컴퓨터 비전 작업을 지원합니다. 그러나 새로운 YOLO11은 성능과 정확도가 향상되어 강력한 도구이자 실제 산업 과제에 완벽한 동반자가 될 것입니다.

어떤 Ultralytics YOLO 모델을 프로젝트에 선택해야 할까요?

사용할 모델은 특정 프로젝트 요구 사항에 따라 다릅니다. 성능, 정확도 및 배포 요구 사항과 같은 요소를 고려하는 것이 중요합니다. 다음은 간단한 개요입니다.

  • Ultralytics YOLOv8의 주요 기능:
  1. 성숙도 및 안정성: YOLOv8은 광범위한 문서와 이전 YOLO 버전과의 호환성을 갖춘 입증된 안정적인 프레임워크이므로 기존 워크플로에 통합하는 데 이상적입니다.
  2. 사용 편의성: 초보자에게 친숙한 설정과 간단한 설치를 통해 YOLOv8은 모든 기술 수준의 팀에 적합합니다.
  3. 비용 효율성: 더 적은 컴퓨팅 리소스가 필요하므로 예산이 제한된 프로젝트에 적합합니다.
  • Ultralytics YOLO11의 주요 기능:
  1. 더 높은 정확도: YOLO11은 벤치마크에서 YOLOv8보다 성능이 뛰어나며 더 적은 파라미터로 더 나은 정확도를 달성합니다.
  2. 고급 기능: 포즈 추정, 객체 추적 및 OBB(Oriented Bounding Boxes)와 같은 최첨단 작업을 지원하여 타의 추종을 불허하는 다재다능함을 제공합니다.
  3. 실시간 효율성: 실시간 애플리케이션에 최적화된 YOLO11은 더 빠른 추론 시간을 제공하고 에지 장치 및 지연 시간에 민감한 작업에서 뛰어난 성능을 발휘합니다.
  4. 적응성: 광범위한 하드웨어 호환성을 갖춘 YOLO11은 에지 장치, 클라우드 플랫폼 및 NVIDIA GPU 전반에 걸쳐 배포하는 데 적합합니다.

어떤 라이선스가 필요한가요?

YOLOv5 및 YOLO11과 같은 Ultralytics YOLO 저장소는 기본적으로 AGPL-3.0 라이선스에 따라 배포됩니다. 이 OSI 승인 라이선스는 학생, 연구원 및 매니아를 위해 설계되었으며, 개방형 협업을 촉진하고 AGPL-3.0 구성 요소를 사용하는 모든 소프트웨어가 오픈 소스화되도록 요구합니다. 이는 투명성을 보장하고 혁신을 촉진하지만 상업적 사용 사례와는 일치하지 않을 수 있습니다.
프로젝트에 Ultralytics 소프트웨어 및 AI 모델을 상업용 제품 또는 서비스에 내장하고 AGPL-3.0의 오픈 소스 요구 사항을 우회하려는 경우 Enterprise License가 이상적입니다.

Enterprise License의 이점은 다음과 같습니다.

  • 상업적 유연성: 프로젝트를 오픈 소스로 공개해야 하는 AGPL-3.0 요구 사항을 준수하지 않고 Ultralytics YOLO 소스 코드 및 모델을 독점 제품에 수정하고 내장할 수 있습니다.
  • 독점 개발: Ultralytics YOLO 코드 및 모델을 포함하는 상업용 애플리케이션을 개발하고 배포할 수 있는 완전한 자유를 얻으십시오.

원활한 통합을 보장하고 AGPL-3.0 제약을 피하려면 제공된 양식을 사용하여 Ultralytics Enterprise License를 요청하십시오. 저희 팀이 귀하의 특정 요구 사항에 맞게 라이선스를 조정하는 데 도움을 드릴 것입니다.

Ultralytics YOLO로 성능 강화

프로젝트에 필요한 고급 AI 비전을 확보하세요. 오늘 목표에 맞는 라이선스를 찾아보세요.

라이선스 옵션 살펴보기
클립보드에 링크가 복사되었습니다.