Semantic Chunking
의미론적 청킹(semantic chunking)이 데이터 컨텍스트를 보존하여 AI 및 RAG 정확도를 높이는 방법을 알아보십시오. Ultralytics YOLO26을 사용하여 시각적 청크를 추출하는 방법을 확인하십시오.
시맨틱 청킹은 대규모 데이터 세트를 더 작고 의미 있는 세그먼트로 나누기 위해 머신러닝(ML) 및 인공지능(AI)에서 사용하는 고급 데이터 전처리 기술입니다. AI 맥락에서 "청킹이란 무엇인가"에 대해 궁금하시다면, 이는 문서, 비디오, 오디오와 같은 비정형 데이터의 긴 시퀀스를 관리 가능한 조각 또는 세그먼트로 분해하는 과정입니다. 일반적인 청킹 정의는 흔히 고정된 문자 수 또는 시간 간격으로 데이터를 분할하는 것을 포함합니다. 그러나 "의미 청킹" 또는 시맨틱 청킹은 한 걸음 더 나아가 맥락을 분석하고 관련 정보를 함께 그룹화합니다. 이를 통해 핵심 메시지가 손상되지 않도록 보장하며, 임의의 분할 방식에서 빈번하게 발생하는 맥락 손실을 방지합니다.
Link to this section시맨틱 청킹은 어떻게 작동하는가?#
시맨틱 청킹 수행 방법을 이해하려면 현대적인 생성형 파이프라인에서의 역할을 살펴보는 것이 도움이 됩니다. 그렇다면 RAG에서 시맨틱 청킹이란 무엇일까요? 벡터 데이터베이스를 위한 데이터를 준비할 때, 임베딩 모델은 인접한 문장이나 시각적 요소를 분석하고 그 관계를 계산합니다. 코사인 유사도와 같은 통계적 지표를 사용하여 시스템은 주제가 전환되는 지점(종종 브레이크포인트라고 함)을 식별하고 해당 지점에서 데이터를 분할합니다. 이는 쿼리 중에 대규모 언어 모델(LLM)이 검색하는 데이터 청크가 완벽하고 일관된 생각을 포함하도록 보장하며, 생성된 응답의 정확도를 크게 향상합니다. RAPTOR 및 적응형 그래프 클러스터링에 대한 최근 연구들은 이러한 맥락 인식 전략이 고정 크기 분할보다 뛰어난 성능을 보임을 강조합니다.
Link to this section컴퓨터 비전에서의 시맨틱 청킹#
시맨틱 청킹은 전통적으로 자연어 처리(NLP)와 관련되어 있지만, 컴퓨터 비전 및 멀티모달 AI에서도 매우 관련이 깊습니다. 예를 들어 문서 분석에서 시각적 시맨틱 청크는 엄격한 페이지 경계에 따라 차트와 설명 캡션을 분리하는 대신 이들을 함께 유지할 수 있습니다. 고급 클라우드 제공업체와 API 도구는 이러한 복잡한 데이터 유형을 관리하기 위한 특수 시맨틱 청킹 구성을 제공합니다.
개발자는 Ultralytics YOLO26 모델을 활용하여 이러한 시각적 청크 추출을 자동화할 수 있습니다. 이미지나 비디오 내의 객체를 감지함으로써 장면의 핵심 내용을 나타내는 의미 있는 로컬 세그먼트를 생성할 수 있습니다.
from ultralytics import YOLO
# Load an Ultralytics YOLO26 model to extract visual semantics
model = YOLO("yolo26n.pt")
# Run inference to detect objects within a visual scene
results = model("scene.jpg")
# Group detected object classes to form a semantic visual chunk
visual_chunk = [model.names[int(cls)] for cls in results[0].boxes.cls]
print(f"Semantic visual chunk elements: {visual_chunk}")Link to this section실제 애플리케이션 사례#
시맨틱 청킹은 다양한 AI 워크플로우 전반에서 중요한 과제를 해결합니다. 다음은 두 가지 구체적인 예시입니다.
- 문서 AI를 위한 멀티모달 RAG: 재무 보고서와 같이 복잡한 PDF를 파싱할 때, 시각적 청킹은 바운딩 박스로 둘러싸인 테이블이 해당 텍스트 요약과 함께 그룹화되도록 보장합니다. 이를 통해 AI 비서는 수치 맥락을 잃지 않고 매우 구체적인 질문에 정확하게 답변할 수 있습니다.
- 자동 비디오 요약: 보안 및 감시 분야에서 연속적인 비디오 스트림은 사람이 제한 구역에 진입하는 것과 같은 감지된 이벤트에 따라 시맨틱하게 청킹됩니다. 객체 추적을 사용하여 시스템은 무작위적인 10초 슬라이스를 반환하는 대신 관련 프레임을 실행 가능한 비디오 클립으로 그룹화합니다. 이러한 방대한 데이터 세트를 관리하는 팀은 종종 Ultralytics Platform을 사용하여 이러한 복잡한 이벤트 기반 파이프라인을 원활하게 주석 처리, 학습 및 배포합니다.
Link to this section관련 개념#
이 기술을 유사한 AI 용어와 구별하는 것이 중요합니다.
- 액션 청킹(Action Chunking): 시맨틱 청킹이 최적의 검색을 위해 데이터를 의미별로 그룹화하는 반면, 액션 청킹은 로봇 공학에서 (로봇 팔의 궤적과 같은) 물리적 움직임의 시퀀스를 단일 실행 가능 액션으로 그룹화합니다.
- 시맨틱 검색(Semantic Search): 시맨틱 청킹은 정확한 정보 검색을 가능하게 하는 필수적인 데이터 준비 단계이며, 반면 시맨틱 검색은 사용자 의도에 따라 준비된 청크를 가져오는 실제 쿼리 프로세스입니다.






