용어집

질의 응답

인공지능(AI)과 자연어 처리(NLP) 분야의 질문응답(QA) 기술을 탐구해 보세요. 시스템이 데이터에서 사실 기반 답변을 추출하는 방식을 배우고, Ultralytics 시각적 QA 작업을 어떻게 지원하는지 알아보세요.

질문응답(QA)은 인공 지능(AI) 및 자연어 처리(NLP) 분야의 전문 분야로, 인간이 자연어로 제기한 질문에 자동으로 답변하는 시스템 구축에 중점을 둡니다. 관련 문서나 웹 페이지 목록을 검색해 제공하는 기존 검색 엔진과 달리, QA 시스템은 사용자의 질의 의도를 이해하고 정확하며 사실에 기반한 답변을 제공하려 합니다. 이러한 능력은 방대한 비정형 데이터 저장소와 사용자의 구체적인 정보 요구 사이의 간극을 메워주며, 현대 AI 에이전트와 가상 비서의 핵심 구성 요소로 자리매김하고 있습니다.

질의 응답 작동 방식

질문응답 시스템의 핵심은 크게 세 단계로 이루어집니다: 질문 처리, 문서 검색, 답변 추출입니다. 먼저 시스템은 입력된 질의를 분석하여 질문의 유형(예: "누가", "어디서", "어떻게" 질문)을 파악하고 핵심 개체를 식별합니다. 다음으로, 폐쇄형 매뉴얼 집합이나 공개 인터넷과 같은 지식 기반을 검색하여 쿼리와 관련된 문단을 찾습니다. 마지막으로, 기계 독해 이해와 같은 고급 기법을 사용하여 텍스트 내에서 정확한 답변을 찾아내거나 종합된 정보를 바탕으로 응답을 생성합니다.

현대적인 QA 시스템은 높은 정확도를 달성하기 위해 대규모 언어 모델(LLM) 과 BERT(Bidirectional Encoder Representations from Transformers)와 같은 트랜스포머를 활용하는 경우가 많습니다. 이러한 모델들은 방대한 양의 텍스트로 사전 훈련되어 키워드 기반 방법보다 문맥, 미묘한 차이, 의미적 관계를 더 잘 파악할 수 있습니다.

질의 응답 시스템의 유형

QA 시스템은 일반적으로 접근하는 데이터의 도메인과 지원하는 모달리티에 따라 분류됩니다.

개방형 질의응답(Open-Domain QA): 이러한 시스템은 일반적으로 방대한 데이터셋이나 공개 인터넷에 접근하여 거의 모든 주제에 대한 질문에 답합니다. 예를 들어 아마존 알렉사(Amazon Alexa )나 애플 시리(Apple Siri) 같은 음성 비서에게 제기되는 일반적인 질의가 이에 해당합니다.
폐쇄형 도메인 QA: 법률 문서나 의료 기록과 같은 특정 주제에 국한됩니다. 범위를 제한함으로써 이러한 시스템은 종종 더 높은 정확도를 달성하고 대규모 언어 모델( LLM)의 환각 현상 위험을 줄입니다.
시각적 질문 답변(VQA): 이 고급 변형은 시스템이 이미지를 기반으로 질문에 답변하도록 요구합니다(예: "차량 색상은 무엇입니까?"). VQA는 텍스트 처리와 컴퓨터 비전(CV) 을 결합하여 동시에 "보고" "읽는" 다중 모달 AI를 필요로 합니다.

실제 애플리케이션

QA 기술의 도입은 산업계가 방대한 양의 비정형 데이터와 상호작용하는 방식을 변화시키고 있다.

의료 및 임상 지원: 의료 분야 인공지능 영역에서 QA 시스템은 PubMed 같은 저장소에서 약물 상호작용, 증상 또는 치료 프로토콜을 신속하게 찾아내 의료 전문가를 지원합니다. 앨런 인공지능 연구소 같은 기관들은 향상된 QA를 통해 과학적 발견을 가속화하기 위해 의미론적 학자들을 적극적으로 개발 중입니다.
기업 지식 관리: 대기업들은 QA 기능을 갖춘 내부 봇을 활용하여 직원들이 내부 정책 정보나 기술 문서를 즉시 찾을 수 있도록 지원함으로써 수동 검색에 비해 생산성을 크게 향상시킵니다.
자동화된 고객 지원: 소매업에 인공지능( AI)을 통합함으로써 기업들은 주문 상태나 반품 정책에 관한 특정 사용자 문의를 해결하기 위해 QA 봇을 배치하여, 사람의 개입 없이 연중무휴 지원을 제공합니다.

시각적 구성 요소: 시각과 텍스트의 가교 역할

시각적 질문응답(VQA)을 위해 시스템은 먼저 장면 내 객체와 그 관계를 식별해야 합니다. 고성능 객체 탐지 모델은 QA 시스템의 '눈' 역할을 합니다. 최신 Ultralytics 모델은 이 작업에 이상적이며, 장면 요소를 신속하고 정확하게 탐지하여 추론을 위한 언어 모델에 입력할 수 있습니다.

다음 Python Ultralytics 모델을 사용하여 이미지에서 시각적 컨텍스트(객체)를 추출하는 방법을 보여줍니다. 이는 VQA 파이프라인의 기초 단계입니다:

from ultralytics import YOLO

# Load a pre-trained YOLO26 model (latest generation)
model = YOLO("yolo26n.pt")

# Perform inference to identify objects in the image
# This provides the "visual facts" for a QA system
results = model("https://ultralytics.com/images/bus.jpg")

# Display the detected objects and their labels
results[0].show()

질의 응답

산업 전반의 워크플로우를 간소화하기 위한 Ultralytics YOLO 모델 교육

혁신을 강화하는 유연한 엔터프라이즈 라이선스 솔루션

Ultralytics YOLO 몇 초 만에 AI 모델 훈련하기

질의 응답 작동 방식

질의 응답 시스템의 유형

실제 애플리케이션

시각적 구성 요소: 시각과 텍스트의 가교 역할

관련 개념

이 카테고리에서 더 읽어보기

컴퓨터 비전으로 구현된 12가지 항공 이미지 활용 사례

단안 깊이 추정이란 무엇인가? 개요

Ultralytics YOLO 활용한 AI 위협 탐지 기술 분석

Ultralytics 커뮤니티 가입