Data Preprocessing

Veri ön işlemenin ham verileri yapay zeka için temiz girdilere nasıl dönüştürdüğünü öğren. Ultralytics YOLO26 doğruluğunu artırmak için ölçeklendirme ve normalleştirme gibi temel teknikleri keşfet.

Veri ön işleme, ham verilerin algoritmalar için temiz ve anlaşılır bir formata dönüştürüldüğü makine öğrenimi sürecindeki kritik ilk adımdır. Gerçek dünyada veriler genellikle eksik, tutarsızdır ve belirli davranışlardan veya eğilimlerden yoksundur, bu da bilgisayar için "kirli" veya "gürültülü" görünmelerine neden olur. Ön işleme, ham bilgiler ile sinir ağlarının gerektirdiği yapılandırılmış girdiler arasındaki boşluğu doldurarak nihai modelin doğruluğu ve verimliliği üzerinde önemli bir etkiye sahip olur. Mühendisler, veri kümelerini standartlaştırıp temizleyerek YOLO26 gibi karmaşık mimarilerin gürültü yerine anlamlı kalıpları öğrenebilmesini sağlarlar.

Link to this sectionVeri Ön İşleme Neden Önemlidir?#

Makine öğrenimi modelleri, özellikle bilgisayarlı görü alanında kullanılanlar, girdi verilerinin kalitesine ve ölçeğine karşı hassastır. Uygun bir ön işleme olmadan, bir model eğitim sırasında yakınsamakta zorlanabilir veya güvenilmez tahminler üretebilir. Örneğin, bir veri kümesindeki görüntüler farklı çözünürlüklere veya renk ölçeklerine sahipse, modelin gerçek nesne algılama görevine odaklanmak yerine bu tutarsızlıkları yönetmeyi öğrenmek için ekstra kapasite harcaması gerekir.

Ön işleme teknikleri genel olarak şunları hedefler:

Veri Kalitesini Artırmak: Veri kümesinin problem alanını doğru bir şekilde temsil etmesini sağlamak için hataları, aykırı değerleri ve kopyaları kaldırır.
Girdileri Standartlaştırmak: Gradyan inişi gibi optimizasyon algoritmalarının daha sorunsuz çalışmasına yardımcı olmak için özellikleri (piksel değerleri gibi) genellikle 0 ile 1 arasında tek tip bir aralığa ölçekler.
Karmaşıklığı Azaltmak: Boyut azaltma gibi tekniklerle veri temsillerini basitleştirerek öğrenme sürecini hızlandırır.

Link to this sectionÖn İşlemede Temel Teknikler#

Verileri eğitime hazırlamak için birkaç standart yöntem kullanılır ve her biri veri hattında belirli bir amaca hizmet eder.

Veri Temizleme: Bu, eksik değerlerin ele alınmasını (imputasyon), tutarsız etiketlemenin düzeltilmesini ve bozuk dosyaların filtrelenmesini içerir. Görüntü yapay zekası bağlamında bu, bulanık görüntüleri kaldırmak veya yanlış sınırlayıcı kutu koordinatlarını düzeltmek anlamına gelebilir.
Normalizasyon ve Ölçekleme: Piksel yoğunlukları büyük ölçüde değişebildiğinden, görüntüleri normalize etmek yüksek değerli piksellerin öğrenme sürecine baskın gelmemesini sağlar. Yaygın yöntemler arasında Min-Max ölçekleme ve Z-skoru normalizasyonu bulunur.
Kodlama: Sınıf etiketleri ("kedi", "köpek" gibi) gibi kategorik verilerin sayısal formatlara dönüştürülmesi gerekir. One-hot encoding veya etiket kodlama gibi teknikler standart uygulamadır.
Yeniden Boyutlandırma ve Biçimlendirme: Derin öğrenme modelleri genellikle sabit boyutta girdiler bekler. Ön işleme hatları, farklı görüntüleri otomatik olarak gerçek zamanlı çıkarım için yaygın olan 640x640 piksel gibi standart bir boyuta getirir.

Link to this sectionGerçek Dünya Uygulamaları#

Veri ön işleme, ham girdilerin eyleme dönüştürülebilir içgörülere dönüşmesini sağlayarak endüstriler genelinde her yerde mevcuttur.

Link to this sectionTıbbi Görüntüleme Tanısı#

Sağlık yapay zekasında, ön işleme X-ışınlarını veya MRI taramalarını analiz etmek için hayati öneme sahiptir. Ham tıbbi görüntüler genellikle sensörlerden kaynaklanan gürültü veya kullanılan makineye bağlı olarak aydınlatma ve kontrast farklılıkları içerir. Histogram eşitleme gibi ön işleme adımları, tümörleri veya kırıkları daha görünür kılmak için kontrastı artırırken, gürültü azaltma filtreleri görüntü yapısını netleştirir. Bu hazırlık, modellerin tümör tespitini daha yüksek hassasiyetle gerçekleştirmesini sağlar ve yanlış negatifleri azaltarak potansiyel olarak hayat kurtarır.

Link to this sectionOtonom Sürüş#

Kendi kendine giden arabalar, LiDAR, radar ve kameralar dahil olmak üzere birden fazla sensörden gelen girdilere güvenir. Bu sensörler verileri farklı hızlarda ve ölçeklerde üretir. Ön işleme bu akışları senkronize eder ve verileri birleştirmeden önce yağmur veya parlama gibi çevresel gürültüleri filtreler. Otonom araçlar için bu, algılama sisteminin yoldan tutarlı bir görüntü almasını sağlayarak gerçek zamanlı ortamlarda güvenli navigasyonu ve güvenilir yaya algılamayı mümkün kılar.

Link to this sectionİlgili Kavramlar#

Veri ön işlemesini makine öğrenimi iş akışında görünen diğer terimlerden ayırmak önemlidir.

vs. Veri Artırma: Ön işleme verileri model tarafından teknik olarak kullanılabilir hale getirmek için hazırlarken (örneğin yeniden boyutlandırma), veri artırma mevcut verilerin yeni varyasyonlarını oluşturarak (örneğin görüntüleri döndürme veya çevirme) veri kümesi çeşitliliğini artırır. Daha fazla ayrıntı için YOLO veri artırma kılavuzumuza bakın.
vs. Özellik Mühendisliği: Ön işleme, temizleme ve biçimlendirme ile ilgilidir. Özellik mühendisliği, boy ve kilo sütunlarından "vücut kitle indeksi" hesaplamak gibi, model performansını iyileştirmek için veriden yeni ve anlamlı değişkenler oluşturmayı içerir.
vs. Veri Etiketleme: Etiketleme, nesnelerin etrafına sınırlayıcı kutular çizmek gibi temel gerçeği tanımlama sürecidir. Ön işleme, veri toplama ve etiketlemeden sonra ancak veriler sinir ağına beslenmeden önce gerçekleşir.

Link to this sectionPratik Örnek#

Ultralytics ekosisteminde, ön işleme genellikle eğitim hattı sırasında otomatik olarak gerçekleştirilir. Ancak, OpenCV gibi kütüphaneleri kullanarak görüntüleri manuel olarak da ön işleyebilirsiniz. Aşağıdaki kod parçacığı bir görüntünün yüklenmesini, YOLO26 gibi bir model için standart bir girdi boyutuna yeniden boyutlandırılmasını ve piksel değerlerinin normalize edilmesini göstermektedir.

import cv2
import numpy as np

# Load an image using OpenCV
image = cv2.imread("bus.jpg")

# Resize the image to 640x640, a standard YOLO input size
resized_image = cv2.resize(image, (640, 640))

# Normalize pixel values from 0-255 to 0-1 for model stability
normalized_image = resized_image / 255.0

# Add a batch dimension (H, W, C) -> (1, H, W, C) for inference
input_tensor = np.expand_dims(normalized_image, axis=0)

print(f"Processed shape: {input_tensor.shape}")

Büyük ölçekli projeler için Ultralytics Platform gibi araçlardan yararlanmak bu iş akışlarını kolaylaştırabilir. Platform, veri kümesi yönetimini basitleştirerek ham veriden dağıtılmış modele geçişi hızlandırmak için birçok ön işleme ve ek açıklama görevini otomatikleştirir.