YOLO Vision 2025를 놓치지 마세요!
2025년 9월 25일
10:00 — 18:00 BST
하이브리드 이벤트
Yolo Vision 2024
용어집

벡터 검색

벡터 검색이 NLP, 시각적 검색, 추천 시스템 등을 위한 데이터 검색에서 의미론적 유사성을 가능하게 함으로써 AI에 혁명을 일으키는 방법을 알아보세요!

벡터 검색은 데이터를 임베딩으로 알려진 숫자 벡터로 표현하여 대규모 데이터 세트에서 유사한 항목을 찾는 방법입니다. 정확한 키워드를 일치시키는 대신 의미상 또는 문맥상 유사한 항목을 식별합니다. 이 접근 방식은 현대적인 인공 지능(AI) 시스템의 기본이며 이미지, 텍스트 및 오디오와 같은 복잡한 데이터 유형에 대해 보다 직관적이고 정확한 정보 검색을 가능하게 합니다. 문자 그대로의 쿼리를 넘어 근본적인 의미나 의도를 이해하여 정교한 검색 및 추천 엔진을 구축하는 데 강력한 도구입니다.

Vector Search는 어떻게 작동하나요?

벡터 검색 과정은 원시 데이터를 의미 기반으로 검색 가능한 형식으로 변환하는 몇 가지 주요 단계를 포함합니다. 이는 딥러닝 모델과 효율적인 알고리즘에 의해 구동됩니다.

  1. 임베딩 생성: 먼저 머신 러닝 모델(예: 트랜스포머 또는 CNN(컨볼루션 신경망))은 데이터 항목(예: 문장, 이미지, 사용자 프로필)을 임베딩이라고 하는 고차원 숫자 벡터로 변환합니다. 각 벡터는 항목의 의미론적 본질을 캡처합니다.
  2. 인덱싱: 생성된 벡터는 특수 벡터 데이터베이스에 저장되고 인덱싱됩니다. Pinecone 또는 Milvus와 같은 이러한 데이터베이스는 방대한 양의 벡터 데이터를 효율적으로 관리하고 쿼리하도록 최적화되어 있습니다.
  3. 쿼리: 사용자가 쿼리(텍스트 구문 또는 이미지와 같은)를 제출하면 동일한 모델을 사용하여 벡터로 변환됩니다.
  4. 유사성 계산: 그런 다음 시스템은 알고리즘을 사용하여 데이터베이스에서 쿼리 벡터에 "가장 가까운" 벡터를 찾습니다. 이는 종종 코사인 유사성 또는 유클리드 거리와 같은 거리 메트릭을 사용하여 수행됩니다. 대규모 데이터 세트를 처리하기 위해 시스템은 일반적으로 정확하지는 않더라도 관련성이 높은 일치 항목을 찾는 빠르고 확장 가능한 검색을 위해 ANN(Approximate Nearest Neighbor) 알고리즘(예: ScaNN 또는 Faiss)을 사용합니다.

실제 애플리케이션

벡터 검색은 많은 고급 AI 기능의 배후에 있는 기술입니다. 시스템이 단순한 매칭을 넘어 다양한 산업 분야에서 상황 인식 결과를 제공할 수 있도록 지원합니다.

  • 시맨틱 이미지 검색: 수동 태그나 파일 이름에 의존하는 대신 사용자는 설명적인 자연어 구문을 사용하여 이미지를 검색할 수 있습니다. 예를 들어 사용자는 "해질녘 산길을 달리는 자동차"를 검색할 수 있으며, 시스템은 문맥에서 "자동차", "산" 및 "해질녘"의 개념을 이해하여 시각적으로 유사한 이미지를 검색합니다. Ultralytics의 유사성 검색 가이드를 통해 작동 방식을 알아볼 수 있습니다.
  • 추천 시스템: 전자 상거래 및 스트리밍 플랫폼은 벡터 검색을 사용하여 제품 또는 콘텐츠를 추천합니다. SF 영화를 시청하면 서비스는 벡터 임베딩을 비교하여 장르, 분위기 및 줄거리가 유사한 다른 영화를 찾아 제안할 수 있습니다. 이는 사용자 경험과 참여를 향상시키기 위한 소매업의 AI의 핵심 기능입니다.

벡터 검색 vs. 관련 개념

AI 생태계에서 벡터 검색의 구체적인 역할을 이해하려면 관련 용어와 구별하는 것이 좋습니다.

  • 키워드 검색: 기존 키워드 검색은 정확한 단어 또는 구문을 일치시키는 데 의존합니다. 동의어, 컨텍스트 및 언어적 뉘앙스에 어려움을 겪습니다. 대조적으로 벡터 검색은 의미적 관계를 이해하여 키워드가 정확히 일치하지 않더라도 관련 결과를 찾을 수 있습니다.
  • 시맨틱 검색: 시맨틱 검색은 쿼리의 의도와 문맥적 의미를 이해하는 광범위한 개념입니다. 벡터 검색은 시맨틱 검색을 구현하는 데 사용되는 핵심 방법입니다. 시맨틱 검색이 "무엇"(의미 이해)인 반면, 벡터 검색은 "어떻게"(벡터 근접성을 기반으로 하는 검색 메커니즘)입니다.
  • 임베딩: 임베딩은 데이터의 벡터 표현입니다. 벡터 검색은 가장 유사한 임베딩을 찾기 위해 임베딩 모음을 쿼리하는 프로세스입니다. 임베딩은 데이터이고, 벡터 검색은 해당 데이터에 대해 수행되는 작업입니다.
  • 벡터 데이터베이스: 벡터 데이터베이스는 임베딩을 저장, 인덱싱하고 효율적으로 쿼리하기 위한 특수화된 인프라입니다. Ultralytics HUB와 같은 플랫폼은 벡터 검색 시스템에서 사용하기 위해 이러한 임베딩을 생성하는 데이터 세트 및 모델을 관리하는 데 도움을 줍니다.

임베딩의 강력한 기능과 정교한 검색 알고리즘을 활용하여 벡터 검색은 인간의 의도와 디지털 데이터 간의 간극을 좁혀주므로 자연어 처리(NLP)부터 고급 컴퓨터 비전 작업에 이르기까지 다양한 지능형 애플리케이션에 필수적인 요소입니다.

Ultralytics 커뮤니티에 참여하세요

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기
클립보드에 링크가 복사되었습니다.