Ultralytics의 시맨틱 이미지 검색 솔루션 살펴보기

아비라미 비나

5분 읽기

2025년 6월 23일

Ultralytics의 시맨틱 이미지 검색 솔루션을 사용하여 이미지를 쿼리와 빠르게 일치시켜 크리에이티브 및 연구 워크플로우를 보다 효율적으로 만드는 방법을 알아보세요.

수백 개의 이미지로 구성된 갤러리를 살펴보는 것은 특히 매우 특정한 것을 찾으려고 할 때 금방 압도적인 작업이 될 수 있습니다. 예를 들어 고대 로마의 지도를 검색하는 사람이 무작위로 도시 지도나 여행 사진을 발견할 수도 있습니다.

이러한 시나리오는 대부분의 이미지 검색 시스템이 파일 이름이나 태그에 의존하기 때문에 발생합니다. 이는 일반적인 쿼리에는 효과적일 수 있지만 정확성, 세부 정보 및 컨텍스트가 필요한 경우에는 종종 부족합니다. 

실제로 디자인, 마케팅, 리서치와 같은 분야의 많은 사람들은 키워드 검색으로 원하는 특정 아이디어를 포착하는 경우가 드물기 때문에 적절한 이미지를 찾는 데 어려움을 겪습니다. 이로 인해 작업이 지연되고 생산성이 저하될 수 있습니다.

하지만 최근 인공지능(AI)의 발전으로 이미지 검색 도구의 전통적인 한계가 보다 스마트하고 직관적인 시스템으로 대체되고 있습니다. 예를 들어, 시각적 데이터를 해석하고 이해하는 데 중점을 둔 AI의 한 분야인 컴퓨터 비전은 이미지의 실제 내용을 분석하여 더 빠르고 정확한 이미지 검색을 가능하게 하고 있습니다.

특히 시맨틱 이미지 검색은 검색어 뒤에 숨겨진 의미를 이해함으로써 키워드를 일치시키는 것 이상의 기능을 제공합니다. 자연어를 사용해 찾고자 하는 내용을 설명할 수 있으며, 태그뿐만 아니라 아이디어와 일치하는 이미지를 찾아줍니다. 예를 들어, '동물원의 동물'을 검색하면 기존 시스템에서는 임의의 동물 이미지가 반환되지만, 시맨틱 검색은 문맥을 이해하여 동물원 배경의 동물 이미지를 찾아냅니다.

그림 1. 시맨틱 이미지 검색을 사용하여 동물원의 동물 이미지를 검색하는 예시입니다.

이 문서에서는 시맨틱 이미지 검색이 어떻게 작동하는지 살펴보고 몇 가지 실제 사용 사례에 대해 논의합니다. 또한 이 개념을 일상적인 프로젝트에 쉽게 적용할 수 있는 Ultralytics의 시맨틱 이미지 검색 솔루션에 대해서도 살펴볼 것입니다. 시작해 보겠습니다!

Ultralytics의 시맨틱 이미지 검색 솔루션 개요

Ultralytics Python 패키지는 대기열 관리, 영역 기반 개체 수 계산, 거리 계산, 시맨틱 이미지 검색 등 일반적인 컴퓨터 비전 애플리케이션을 위해 바로 사용할 수 있는 다양한 솔루션을 제공합니다. 이러한 솔루션은 AI 또는 컴퓨터 비전에 대한 전문 지식이 없는 사용자도 쉽게 사용할 수 있도록 설계되었습니다.

그중 시맨틱 이미지 검색 솔루션은 사용자가 파일 이름이나 수동 태그에 의존하지 않고 자연어 설명을 사용해 관련 이미지를 찾을 수 있게 해줍니다. 검색어 뒤에 숨어 있는 의미를 이해하고 그 아이디어와 일치하는 이미지를 반환하므로 정확성과 맥락이 중요한 경우에 특히 유용합니다.

시맨틱 이미지 검색 솔루션의 작동 방식

Ultralytics의 시맨틱 이미지 검색 솔루션은 두 가지 고급 AI 모델을 기반으로 합니다: OpenAI의 CLIP(대조 언어 - 이미지 사전 학습)과 Meta의 FAISS(Facebook AI 유사도 검색)가 그것입니다. CLIP은 텍스트와 이미지를 모두 임베딩이라는 숫자 표현으로 변환하여 그 의미와 맥락을 포착합니다. FAISS는 이러한 수백만 개의 임베딩을 효율적으로 검색하여 검색어와 가장 연관성이 높은 임베딩을 찾아냅니다. 

또한 Flask로 구축된 간소화된 웹 인터페이스를 통해 솔루션을 쉽게 사용할 수 있습니다. 사용자는 수동 라벨링이나 데이터 준비 없이도 자연어 쿼리를 입력하고 일치하는 이미지를 검색할 수 있습니다.

이 솔루션의 주요 장점 중 하나는 제로 샷 기능입니다. 즉, 특별히 학습되지 않은 사물이나 장면에 대한 쿼리를 해석하고 응답할 수 있습니다. 언어와 비주얼에 대한 폭넓은 이해를 활용하여 익숙하지 않거나 태그가 없는 콘텐츠에 대해서도 관련성 있는 결과를 반환할 수 있습니다.

예를 들어, 이 솔루션을 사용해 '사무실 환경'을 검색하면 해당 단어가 파일에 연결되어 있지 않더라도 책상, 회의실 또는 작업 공간의 이미지가 반환될 수 있습니다. 따라서 Ultralytics의 시맨틱 이미지 검색은 창의적인 프로젝트, 연구, 대규모 이미지 라이브러리 작업에 실용적이고 유연한 도구가 될 수 있습니다.

그림 2. Ultralytics의 시맨틱 이미지 검색 솔루션을 사용하여 사무실 환경의 이미지를 쿼리하는 모습.

시맨틱 이미지 검색 솔루션의 실제 적용 사례

이제 Ultralytics의 시맨틱 이미지 검색 솔루션에 대해 더 잘 이해했으니, 실제 애플리케이션을 살펴보고 다양한 산업에서 이를 시각적 워크플로우에 어떻게 통합할 수 있는지 알아보겠습니다.

데이터 세트 관리를 위한 AI 기반 이미지 검색 도구 사용

방대한 이미지 데이터세트를 관리하는 것은 컴퓨터 비전 솔루션을 구축하는 데 가장 많은 시간이 소요되는 작업 중 하나입니다. 대부분의 경우 개발자는 전체 데이터 세트가 필요하지 않습니다. 대신 모델을 학습시키거나 깨끗한 유효성 검사 세트를 만들기 위해 특정 유형의 이미지를 찾고 있을 수 있습니다. 하지만 수천 개의 이미지 중에서 정확한 이미지를 찾는 것은 까다로울 수 있습니다.

승마 이미지와 관련된 프로젝트를 진행하고 있다고 가정해 보겠습니다. 라이더가 헬멧을 쓰고 있거나, 다른 사람과 함께 타거나, 옆에서 동작 중에 촬영한 사진만 필요할 수 있습니다. 적절한 레이블이 없으면 이러한 이미지를 수동으로 찾으려면 많은 시간과 노력이 필요할 수 있습니다.

Ultralytics에서 지원하는 시맨틱 이미지 검색 솔루션은 개발자가 자연어 쿼리를 사용하여 지저분하거나 레이블이 없는 데이터 세트에서도 필요한 것을 빠르게 찾을 수 있게 함으로써 이 문제를 해결할 수 있습니다. 이를 통해 정렬에 소요되는 시간을 줄이고 팀은 보다 효율적으로 더 나은 모델을 구축하는 데 집중할 수 있습니다.

그림 3. 대규모 데이터 세트에서 특정 이미지를 쉽게 검색할 수 있습니다.

이커머스 제품에 대한 제로샷 이미지 검색 

온라인에서 특정 제품을 검색하는 것은 답답할 수 있습니다. 쇼핑객은 종종 자신이 찾고 있는 제품을 직접 말로 설명하지만 제품 목록은 다른 용어나 레이블을 사용할 수 있습니다. 이러한 불일치로 인해 특히 대규모 카탈로그에서 올바른 상품을 찾기가 더 어려워집니다.

가구를 쇼핑하는 사람이 "소파, 의자, 테이블 세트"를 검색하는 상황을 생각해 보세요. 찾고자 하는 제품이 '라운지 3인 세트'와 같은 다른 레이블로 표시될 수 있습니다. 용어가 정확히 일치하지 않기 때문에 고객이 원하는 상품임에도 불구하고 검색 결과에 해당 상품이 표시되지 않을 수 있습니다.

그림 4. Ultralytics의 시맨틱 이미지 검색 솔루션은 사용자의 의도를 관련 제품 비주얼과 일치시키는 데 도움을 줍니다.

미디어 및 퍼블리싱을 위한 고급 이미지 인덱싱

마찬가지로 저널리즘, 블로그, 디지털 마케팅과 같은 분야에서도 스토리텔링에 있어 시각적 요소는 필수적입니다. 적절한 이미지는 메시지를 뒷받침하고 분위기를 조성하며 독자의 참여를 유도할 수 있습니다. 하지만 완벽한 이미지를 찾으려면 수많은 파일을 샅샅이 뒤져야 하는 경우가 많습니다.

좋은 예로 홈 데코 트렌드에 대해 글을 쓰는 블로거를 들 수 있습니다. 블로거는 자연광이 들어오는 밝고 미니멀한 거실의 이미지를 원할 수 있습니다. 하지만 사용 가능한 이미지에 '방' 또는 '인테리어'와 같은 일반적인 용어만 태그되어 있으면 적합한 이미지를 찾기가 어려울 수 있습니다. 

시맨틱 이미지 검색을 사용하면 '큰 창문이 있는 밝은 미니멀리즘 거실'과 같은 설명 문구를 입력하기만 하면 해당 아이디어와 일치하는 이미지를 즉시 검색할 수 있습니다. 정확한 태그나 파일 이름에 의존할 필요가 없습니다.

그림 5. 콘텐츠 팀은 Ultralytics의 시맨틱 이미지 검색 솔루션을 사용하여 이미지 선택을 최적화할 수 있습니다.

예술 및 디자인 영감을 위한 시맨틱 이미지 검색

일반적으로 무드보드를 디자인하거나 새 프로젝트에 대한 영감을 얻는 등의 창의적인 작업에는 특정 스타일이나 아이디어에 맞는 비주얼을 찾기 위해 방대한 이미지 컬렉션을 검색하는 작업이 포함됩니다. 흥미로운 예로 영화 세트장에서 작업하는 디자이너를 들 수 있습니다. 특정 분위기, 시간대 또는 분위기를 포착해야 할 수도 있습니다. 미래 도시부터 1980년대 스타일의 아늑한 거실까지 다양합니다.

Ultralytics의 시맨틱 이미지 검색은 언어를 시각적 의미와 연결하여 이 작업을 더 쉽게 만들어 줍니다. 이를 통해 팀은 수동 검색으로 인한 속도 저하 없이 아이디어를 빠르게 탐색하고 집중력을 유지할 수 있습니다.

그림 6. Ultralytics의 시맨틱 이미지 검색 솔루션은 창의적인 프로젝트를 위한 빠른 시각적 탐색을 지원합니다.

AI 기반 이미지 검색의 장단점

AI 기반 이미지 검색을 사용하여 시각적 워크플로우와 검색 효율성을 개선할 수 있는 몇 가지 주요 이점은 다음과 같습니다;

  • 자연어 지원: 미리 정의된 레이블을 사용하지 않고도 사용자가 자신의 말로 이미지를 설명하여 이미지를 찾을 수 있습니다.
    ↪cf_200D↩
  • 일반적인 이미지 형식을 지원합니다: 이러한 시스템은 일반적으로 JPG 및 PNG와 같은 표준 포맷으로 작동하므로 파일을 변환하거나 다시 포맷할 필요가 없습니다.
    ↪f_200D↩
  • 다른 도구와 통합: AI 기반 이미지 검색은 종종 더 큰 파이프라인, 대시보드 또는 크리에이티브 소프트웨어에 포함될 수 있습니다.

AI 기반 이미지 검색 솔루션은 많은 이점을 제공하지만, 명심해야 할 몇 가지 제한 사항도 있습니다. 다음은 고려해야 할 몇 가지 요소입니다:

  • 틈새 쿼리의 정확도 제한: 쿼리가 매우 구체적이거나 비정상적인 경우 모델 학습 데이터의 격차로 인해 시스템에서 관련성이 낮은 결과를 반환할 수 있습니다.
    ↪f_200D↩
  • 학습 데이터의 편향성: AI 모델은 학습된 데이터 세트에 존재하는 편향을 반영할 수 있으며, 이로 인해 왜곡되거나 불완전한 결과가 나올 수 있습니다.
    ↪f_200D↩
  • 성능은 이미지 품질에 따라 달라집니다: 해상도가 낮거나 선명하지 않은 이미지는 임베딩 생성의 효율성과 검색 정확도를 떨어뜨릴 수 있습니다.

주요 요점

시맨틱 이미지 검색은 키워드 일치에서 의미 이해로 초점을 전환하여 사용자가 태그나 파일 이름뿐 아니라 문맥을 기반으로 이미지를 찾을 수 있도록 도와줍니다. 따라서 검색 환경이 더 빠르고 정확해지며 사용자가 실제로 찾고자 하는 내용에 더 잘 부합합니다. 

크리에이티브 팀과 콘텐츠 중심 산업의 경우, 관련 없는 파일을 분류하는 데 소요되는 시간을 줄이고 아이디어를 개발하는 데 더 많은 시간을 할애할 수 있습니다. 대량의 시각적 데이터를 관리하는 조직은 Ultralytics의 시맨틱 이미지 검색과 같은 솔루션을 사용하여 콘텐츠 검색을 간소화하고, 수동 정렬을 줄이고, 시각적 컨텍스트를 기반으로 더 스마트하고 빠른 의사 결정을 내릴 수 있습니다.

저희 커뮤니티의 일원이 되어 GitHub 리포지토리를 살펴보고 AI에 대한 더 많은 인사이트를 얻으세요. 물류 분야의 AI와 의료 분야의 컴퓨터 비전과 같은 혁신에 대해 자세히 알아보려면 솔루션 페이지를 살펴보세요. 라이선스 옵션을 확인하고 지금 바로 시작하세요!

인공지능의 미래
를 함께 만들어 갑시다!

머신 러닝의 미래와 함께하는 여정 시작하기

무료로 시작하기
링크가 클립보드에 복사됨