비전 AI 데이터 세트에서 AI 편향 수정

인공 지능(AI) 모델은 문제 해결 방식을 변화시키고 있지만 완벽하지는 않습니다. 자율 주행차부터 의료 분야의 진단 도구에 이르기까지 우리는 AI에 의존하여 데이터를 해석하고 결정을 내립니다. 데이터 자체가 결함이 있으면 어떻게 될까요?

AI의 편향은 모델에서 발생하는 불일치 패턴을 의미하며, 종종 아무도 인식하지 못합니다. 이러한 편향은 모델이 부정확하거나 일관성이 없거나 심지어 해로운 예측을 하게 할 수 있습니다. 컴퓨터 비전에서 편향은 일반적으로 데이터 세트라는 핵심 소스로 거슬러 올라갑니다. 모델을 훈련하는 데 사용된 데이터가 불균형하거나 대표성이 없으면 모델은 이러한 격차를 반영합니다.

데이터 세트 편향이 어떻게 형성되고 컴퓨터 비전 모델에 미치는 영향과 개발자가 이를 감지하고 방지하기 위해 취할 수 있는 단계를 자세히 살펴보겠습니다. 또한 Ultralytics YOLO11과 같은 모델이 새로운 미지의 데이터에서 잘 작동하고 모든 사람에게 더 평등하게 서비스를 제공한다는 의미에서 더 공정한 AI 시스템을 구축하기 위한 노력을 어떻게 지원할 수 있는지 보여드리겠습니다.

AI 편향이란 무엇이며 왜 중요할까요?

AI 편향은 AI 시스템에서 일관되게 발생하는 오류로, 결과가 왜곡되거나 부정확해지는 것을 의미합니다. 더 간단히 말하면, 모델이 더 나은 성능을 발휘해서가 아니라 훈련 방식 때문에 특정 유형의 시각적 입력을 다른 입력보다 선호하기 시작하여 모델의 공정성에 영향을 미칩니다.

이는 모델이 시각적 데이터에서 학습하는 컴퓨터 비전에서 특히 흔할 수 있습니다. 데이터 세트가 주로 한 종류의 객체, 장면 또는 사람을 포함하는 경우 모델은 해당 경우에만 잘 작동하는 패턴을 학습합니다.

대도시의 교통 이미지 위주로 학습된 모델을 상상해 보세요. 이 모델이 농촌 지역에 배포된다면 특이한 도로 구조를 잘못 분류하거나 이전에 본 적 없는 차량 유형을 감지하지 못할 수 있습니다. 이것이 바로 AI 편향의 작동 방식입니다. 이는 낮은 정확도와 제한적인 일반화로 이어지는데, 일반화란 새로운 입력이나 다양한 입력에 대해 모델이 제대로 작동하는 능력을 의미합니다.

의료 또는 보안과 같이 정확성이 필수적인 애플리케이션에서 이러한 실수는 좌절스러울 뿐만 아니라 위험할 수도 있습니다. 편향을 해결하는 것은 성능, 신뢰성 및 안전에 관한 것입니다.

데이터세트 편향이 모델 동작에 미치는 영향

데이터 세트 편향에 대해 이야기할 때, 모델 훈련에 사용되는 데이터의 불균형 또는 제한을 의미합니다. 데이터 세트 편향은 훈련 데이터가 모델링하려는 실제 세계의 다양성을 적절하게 반영하지 못할 때 발생합니다.

컴퓨터 비전 모델은 세상을 이해하지 못합니다. 패턴을 이해합니다. 그들이 보는 개의 이미지가 뒷마당에 있는 골든 리트리버뿐이라면 눈 덮인 길에서 허스키를 인식하지 못할 수 있습니다.

Fig 1. 소스 데이터의 가중치를 재조정하면 모델 정확도를 높일 수 있습니다.

‍

이는 데이터 세트 편향으로 인해 발생하는 주요 문제 중 하나를 강조합니다. 모델은 표시되는 내용을 기반으로 이해도를 구축합니다. 해당 훈련 데이터가 실제 다양성을 반영하지 않으면 모델의 동작이 좁아지고 낯선 조건에서 덜 효과적이 됩니다.

이미지 분류기는 학습에 사용된 데이터 세트와 다른 데이터 세트에서 테스트할 때, 심지어 두 데이터 세트가 동일한 작업을 위해 구축된 경우에도 성능이 크게 저하되는 경우가 많습니다. 조명, 배경 또는 카메라 각도의 작은 변화도 정확도에 눈에 띄는 하락을 초래할 수 있습니다. 이는 데이터 세트 편향이 모델의 일반화 능력에 얼마나 쉽게 영향을 미칠 수 있는지를 보여줍니다.

이것들은 엣지 케이스가 아닙니다. 이것들은 데이터 파이프라인이 모델 아키텍처만큼 중요하다는 신호입니다.

AI 학습 데이터의 편향 유형

편향은 데이터 수집, 라벨링 또는 큐레이션 중에 개발 프로세스에서 미묘한 방식으로 나타날 수 있습니다. 다음은 훈련 데이터에 영향을 미칠 수 있는 세 가지 주요 유형의 편향입니다.

선택 편향

선택 편향은 데이터 세트가 실제 사용에서 보이는 다양성을 나타내지 못할 때 발생할 수 있습니다. 보행자 감지 모델이 맑은 날 주간 이미지로만 학습된 경우 야간이나 안개 속에서는 제대로 작동하지 않습니다. 따라서 선택 과정에서 중요한 사례를 놓치게 됩니다.

‍

이러한 편향은 데이터가 수집된 방식으로 인해 데이터 세트가 실제 시나리오의 전체 범위를 포착하지 못할 때 발생합니다. 예를 들어, 맑은 날 주간 이미지에서만 훈련된 보행자 감지 모델은 안개, 눈 또는 저조도에서 실패할 수 있습니다. 이는 데이터가 이상적이거나 편리한 조건에서 수집될 때 자주 발생하여 다양한 환경에서 모델의 성능을 제한합니다. 더 다양한 설정을 포함하도록 수집 노력을 확대하면 이러한 종류의 편향을 줄이는 데 도움이 됩니다.

또한 온라인 소스에서 구축된 데이터 세트에서 발생할 수도 있으며, 콘텐츠가 특정 위치, 언어 또는 사회 경제적 맥락으로 심하게 치우쳐 있을 수 있습니다. 데이터 세트를 다양화하려는 의도적인 노력이 없으면 모델은 이러한 제한 사항을 상속받게 됩니다.

레이블 편향

레이블 편향은 사람이 주석을 다는 사람이 부정확하거나 일관성 없는 레이블을 적용할 때 발생합니다. 오기입은 무해해 보일 수 있지만 자주 발생하면 모델이 잘못된 연관성을 학습하기 시작합니다.

일관성 없는 레이블링은 특히 객체 감지와 같은 복잡한 작업에서 학습 중에 모델을 혼란스럽게 할 수 있습니다. 예를 들어 한 주석자는 차량을 '승용차'로 레이블링하는 반면 다른 주석자는 유사한 차량을 '트럭'으로 레이블링할 수 있습니다. 이러한 불일치는 모델이 신뢰할 수 있는 패턴을 학습하는 능력에 영향을 미쳐 추론 중 정확도가 떨어집니다.

‍

레이블 편향은 명확하지 않은 주석 지침이나 동일한 데이터에 대한 다양한 해석에서 발생할 수도 있습니다. 문서화가 잘 된 레이블링 표준을 수립하고 품질 관리 검사를 수행하면 이러한 문제를 크게 줄일 수 있습니다.

어노테이터에 대한 지속적인 교육과 여러 어노테이터가 각 샘플을 검토하는 합의 라벨링을 사용하는 것은 라벨 편향을 최소화하고 데이터 세트 품질을 개선하는 데 효과적인 두 가지 전략입니다.

표현 편향

표현 편향은 종종 더 넓은 사회적 불평등을 반영합니다. 부유하거나 연결성이 더 높은 지역에서 수집된 데이터는 대표성이 낮은 인구 또는 환경의 다양성을 포착하지 못할 수 있습니다. 이러한 편향을 해결하려면 간과된 그룹과 상황을 의도적으로 포함해야 합니다.

표현 편향은 특정 그룹 또는 클래스가 데이터 세트에서 과소 대표될 때 발생합니다. 여기에는 인구 통계 그룹, 객체 범주 또는 환경 조건이 포함될 수 있습니다. 모델이 하나의 피부톤, 하나의 객체 유형 또는 하나의 배경 스타일만 보는 경우 예측은 해당 불균형을 반영합니다.

특정 그룹 또는 카테고리가 다른 그룹 또는 카테고리보다 훨씬 적은 수로 포함될 때 이러한 유형의 편향을 관찰할 수 있습니다. 이는 모델의 예측을 데이터 세트의 지배적인 예시로 왜곡할 수 있습니다. 예를 들어, 주로 한 인구 통계에 대해 훈련된 얼굴 인식 모델은 모든 사용자에 대해 정확하게 수행하는 데 어려움을 겪을 수 있습니다. 데이터 다양성과 관련된 선택 편향과 달리, 표현 편향은 그룹 간의 균형과 관련이 있습니다.

다양성 감사를 실시하고, 목표 데이터 확장 전략을 활용하면 모든 관련 인구 통계 및 범주가 학습 데이터 세트 전체에 적절하게 표현되도록 할 수 있습니다.

데이터 세트 편향 감지 및 완화 방법

실제 환경에서 AI 편향은 몇 가지 부정확한 예측만을 의미하지 않습니다. 일부 사람들에게는 잘 작동하지만 모든 사람에게 잘 작동하지 않는 시스템을 초래할 수 있습니다.

자동차 AI 분야에서 객체 탐지 모델은 보행자 그룹에 따라 일관성 없는 성능을 보일 수 있으며, 이는 소외된 사람들의 안전 결과를 저하시키는 원인이 됩니다. 문제는 모델의 의도가 아니라 모델이 학습한 시각적 입력 데이터에 있습니다. 농업 분야에서도 객체 탐지의 편향은 조명이나 날씨 조건이 다른 환경에서 작물 식별을 저해할 수 있습니다. 이러한 문제는 제한적이거나 불균형한 데이터 세트로 모델을 학습할 때 흔히 발생합니다.

AI 편향 수정은 어디를 봐야 할지 아는 것에서 시작합니다. 훈련 세트에 중요한 예제가 없거나 좁은 범위가 과도하게 나타나는 경우 모델은 이러한 격차를 반영합니다. 그렇기 때문에 AI 편향 감지는 모든 개발 파이프라인에서 중요한 단계입니다.

‍

데이터 세트를 분석하는 것으로 시작하십시오. 클래스, 환경, 조명, 객체 스케일 및 인구 통계에 따른 분포를 살펴보십시오. 한 범주가 지배적인 경우 모델은 다른 범주에서 성능이 저하될 가능성이 높습니다.

다음으로 성능을 살펴보십시오. 모델이 특정 설정이나 특정 객체 유형에서 더 나쁜 성능을 보이나요? 그렇다면 이는 학습된 편향의 신호이며, 일반적으로 데이터로 다시 연결됩니다.

슬라이스 수준 평가는 매우 중요합니다. 모델은 평균적으로 90%의 정확도를 보고할 수 있지만 특정 그룹 또는 조건에서는 60%에 불과할 수 있습니다. 이러한 슬라이스를 확인하지 않으면 절대 알 수 없습니다.

훈련 및 평가 중에 공정성 지표를 사용하는 것도 강력한 도구입니다. 이러한 지표는 표준 정확도 점수를 넘어 데이터의 여러 하위 집합에서 모델이 어떻게 작동하는지 평가합니다. 이를 통해 간과할 수 있는 사각지대를 드러내는 데 도움이 됩니다.

데이터 세트 구성 및 모델 테스트의 투명성은 더 나은 모델로 이어집니다.

데이터 다양성 및 증강을 통한 공정성 향상

편향을 식별한 후 다음 단계는 격차를 해소하는 것입니다. 이를 수행하는 가장 효과적인 방법 중 하나는 AI 모델에서 데이터 다양성을 높이는 것입니다. 즉, 다양한 모집단의 의료 영상이든 특이한 환경 조건이든 과소 대표되는 시나리오에서 더 많은 샘플을 수집하는 것을 의미합니다.

데이터를 추가하는 것은 특히 다양성을 높일 때 유용할 수 있습니다. 하지만 공정성을 개선하는 것은 적절한 종류의 예제를 수집하는 데 달려 있습니다. 이러한 예제는 모델이 마주칠 가능성이 높은 실제 세계의 변화를 반영해야 합니다.

데이터 증강은 또 다른 가치 있는 전략입니다. 뒤집기, 회전, 조명 조정 및 객체 크기 조정은 다양한 실제 조건을 시뮬레이션하는 데 도움이 될 수 있습니다. 증강은 데이터 세트의 다양성을 증가시킬 뿐만 아니라 모델이 모양, 조명 및 컨텍스트의 변화에 더욱 강력해지도록 돕습니다.

대부분의 최신 학습 파이프라인에는 기본적으로 데이터 증강(augmentation)이 포함되어 있지만, 작업별 요구 사항에 따라 조정하는 데 집중하는 것과 같은 전략적 사용이 공정성을 위해 효과적입니다.

합성 데이터를 사용하여 부족한 부분을 채우기

합성 데이터는 실제 예시를 모방하여 인공적으로 생성된 데이터를 의미합니다. 특정 시나리오가 너무 드물거나 민감하여 실제 환경에서 캡처하기 어려울 때 유용한 도구가 될 수 있습니다.

예를 들어, 기계의 드문 결함이나 예외적인 교통 위반을 감지하는 모델을 구축하는 경우, 합성 데이터를 사용하여 이러한 사례를 시뮬레이션할 수 있습니다. 이를 통해 모델은 훈련 세트에서 자주 접하지 못할 수 있는 이벤트로부터 학습할 기회를 얻게 됩니다.

연구에 따르면 특정 합성 데이터를 학습에 도입하면 데이터 세트 편향을 줄이고 인구 통계 그룹 및 환경 전반에서 성능을 향상시킬 수 있습니다.

합성 데이터는 실제 샘플과 함께 사용할 때 가장 효과적입니다. 데이터 세트를 보완하며, 대체하지 않습니다.

YOLO11은 어떻게 윤리적 AI를 지원할까요?

편향 없는 AI 모델을 구축하는 것은 사용하는 도구에 달려 있습니다. YOLO11은 유연하고, 미세 조정이 용이하며, 적응성이 뛰어나 데이터 세트 편향을 줄이는 데 적합하도록 설계되었습니다.

YOLO11은 모델 훈련 중에 고급 데이터 증강 기술을 지원하여 다양한 이미지 컨텍스트와 혼합된 예제를 도입하여 모델 일반화(generalization)를 개선하고 과적합(overfitting)을 줄입니다.

YOLO11은 또한 더욱 효과적인 특징 추출을 위해 개선된 백본 및 넥 아키텍처를 특징으로 합니다. 이러한 업그레이드는 모델이 미세한 세부 사항을 감지하는 능력을 향상시키며, 이는 표준 모델이 어려움을 겪을 수 있는 대표성이 부족하거나 엣지 케이스 시나리오에서 매우 중요합니다.

YOLO11은 엣지 및 클라우드 환경에서 재학습하고 배포하기 쉽기 때문에 팀은 성능 격차를 식별하고 현장에서 편향이 발견되면 모델을 빠르게 업데이트할 수 있습니다.

공정한 AI는 일회성 목표가 아닙니다. 평가, 학습 및 조정의 순환입니다. YOLO11과 같은 도구는 이러한 순환을 더 빠르고 생산적으로 만드는 데 도움이 됩니다.

주요 내용

AI 편향은 공정성에서 성능에 이르기까지 모든 것에 영향을 미칩니다. 컴퓨터 비전 편향은 데이터 세트가 수집, 레이블 지정 및 균형 조정되는 방식에서 비롯되는 경우가 많습니다. 다행히 이를 감지하고 완화하는 입증된 방법이 있습니다.

데이터를 감사하고 다양한 시나리오에서 모델 성능을 테스트하는 것으로 시작하십시오. 대상 데이터 수집, 증강 및 합성 데이터를 사용하여 더 나은 훈련 범위를 만드십시오.

YOLO11은 강력한 증강 기법을 적용하고 편향이 발견될 때 신속하게 대응하여 사용자 정의 모델을 더 쉽게 학습할 수 있도록 지원함으로써 이러한 워크플로우를 지원합니다.

공정한 AI를 구축하는 것은 올바른 일을 하는 것일 뿐만 아니라 더 스마트하고 신뢰할 수 있는 시스템을 구축하는 방법이기도 합니다.

지금 바로 성장하는 커뮤니티에 참여하세요! GitHub 저장소를 탐색하여 AI에 대해 자세히 알아보세요. 자체 컴퓨터 비전 프로젝트를 시작할 준비가 되셨나요? 라이선스 옵션을 확인해 보세요. 솔루션 페이지를 방문하여 제조 분야의 AI와 농업 분야의 Vision AI를 만나보세요!

비전 AI 시스템에서 AI 편향 및 데이터 세트 편향 이해

AI 편향이란 무엇이며 왜 중요할까요?

데이터세트 편향이 모델 동작에 미치는 영향

AI 학습 데이터의 편향 유형

선택 편향

레이블 편향

표현 편향

데이터 세트 편향 감지 및 완화 방법

데이터 다양성 및 증강을 통한 공정성 향상

합성 데이터를 사용하여 부족한 부분을 채우기

YOLO11은 어떻게 윤리적 AI를 지원할까요?

주요 내용

이 카테고리에서 더 읽어보기

비트에서 큐비트까지: 양자 최적화가 AI를 재편하는 방법

초보자를 위한 AI 모델 훈련 방법에 대한 빠른 가이드

앙상블 학습과 AI 및 ML에서의 역할 살펴보기

함께 미래의 AI를 만들어 갑시다!