Öznitelik Mühendisliği
Uzman özellik mühendisliği ile makine öğrenimi doğruluğunu artırın. Etkili özellikler oluşturma, dönüştürme ve seçme tekniklerini öğrenin.
Özellik mühendisliği, ham verileri bilgilendirici verilere dönüştürmek için alan bilgisinden yararlanma sanatı ve bilimidir.
Tahmine dayalı modeller için altta yatan sorunu daha etkili bir şekilde temsil eden nitelikler. Daha geniş kapsamda
makine öğrenimi (ML), ham veri nadiren hazırdır
Anında işleme için; genellikle gürültü, eksik değerler veya algoritmaların yorumlayamadığı formatlar içerir
Doğrudan. Mühendisler yeni özellikler oluşturarak veya mevcut olanları değiştirerek
model doğruluğu ve performansı, genellikle daha iyi
daha karmaşık bir algoritmaya geçmekten daha iyi sonuçlar verir. Bu süreç, ham bilgi ile işlenmemiş bilgi arasındaki boşluğu doldurur.
için gerekli olan matematiksel gösterim ve
Tahmine dayalı modelleme.
Özellik Mühendisliğinde Temel Teknikler
Süreç tipik olarak verilerdeki en ilgili sinyalleri ortaya çıkarmak için tasarlanmış birkaç yinelemeli adımı içerir. Bir yandan
Python 'daki Pandas kütüphanesi gibi araçlar bu manipülasyonları kolaylaştırır.
stratejisi büyük ölçüde spesifik sorun alanının anlaşılmasına dayanır.
-
İmputasyon ve Temizleme: Yeni özellikler oluşturmadan önce verilerin stabilize edilmesi gerekir. Bu şunları içerir
aracılığıyla eksik değerlerin işlenmesi
ile boşlukları doldurmak gibi veri temizleme teknikleri
ortalama, medyan veya tahmin edilen bir değer olarak bilinen bir süreçtir.
imputation.
-
Dönüşüm ve Ölçeklendirme: Birçok algoritma, girdi değişkenleri büyük ölçüde
farklı ölçekler. Gibi teknikler
normalleştirme (verileri 0 ila 1 aralığına ölçekleme)
veya standardizasyon (verilerin ortalama etrafında merkezlenmesi), öğrenme sürecinde tek bir özelliğin baskın olmamasını sağlar
tamamen büyüklüğü nedeniyle.
-
Kategorik Verilerin Kodlanması: Modeller genellikle sayısal girdi gerektirir. Özellik mühendisliği şunları içerir
metin etiketlerini dönüştürme veya
kategorik verilere
sayılar. Yaygın yöntemler arasında etiket kodlama ve
Her kategori için ikili sütunlar oluşturan tek vuruşlu kodlama.
-
Özellik Oluşturma: Bu, yeni değişkenlerin türetildiği yaratıcı yöndür. Örneğin, içinde
Bir gayrimenkul veri kümesinde, "uzunluk" ve "genişlik "i ayrı ayrı kullanmak yerine, bir mühendis
fiyatla daha güçlü bir korelasyon gösteren bir "metrekare" özelliği oluşturmak için bunları çarpın.
-
Özellik Seçimi: Çok fazla özellik eklemek aşağıdakilere yol açabilir
modelin gürültüyü ezberlediği aşırı uyum.
Özyinelemeli özellik eleme gibi teknikler veya
boyutsallık indirgemesi tanımlamaya yardımcı olur
ve yalnızca en etkili nitelikleri koruyun.
Bilgisayarlı Görüde Özellik Mühendisliği
Bilgisayarla görme (CV) alanında, özellik
mühendisliği genellikle şu şekildedir
veri artırımı. Modern derin öğrenme
modeller otomatik olarak hiyerarşi ve kalıpları öğrenir, eğitim verilerini daha sağlam olacak şekilde "tasarlayabiliriz"
Farklı çevresel koşulların simülasyonu. Değiştirme
hiperparametre ayarlama konfigürasyonları
geometrik dönüşümleri içermesi, modelin yönelim veya perspektife göre değişmeyen özellikleri öğrenmesini sağlar.
Aşağıdaki kod parçacığı, eğitim sırasında artırma tabanlı özellik mühendisliğinin nasıl uygulanacağını göstermektedir
YOLO11 model. Gibi argümanları ayarlayarak
degrees ve shearorijinal veri kümesinden yeni özellik varyasyonları sentezliyoruz.
from ultralytics import YOLO
# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")
# Train with augmentation hyperparameters acting as on-the-fly feature engineering
# 'degrees' rotates images +/- 10 deg, 'shear' changes perspective
model.train(data="coco8.yaml", epochs=3, degrees=10.0, shear=2.5)
Gerçek Dünya Uygulamaları
Özellik mühendisliğinin değeri en iyi şekilde farklı sektörlerdeki pratik uygulamalarıyla anlaşılabilir.
-
Finansal Risk Değerlendirmesi: Finans sektöründe, ham işlem kayıtları aşağıdakiler için yetersizdir
kredi itibarının değerlendirilmesi. Uzmanlar kullanıyor
Finans alanında yapay zeka
"borç-gelir" veya "kredi kullanım oranı" gibi oranlar oluşturmak için. Bu mühendislik
özellikler, finansal sağlığın doğrudan bir sinyalini sağlayarak daha kesin
kredi riski modellemesi ile karşılaştırıldığında
maaş ya da borç rakamları tek başına değerlendirilemez.
-
Üretimde Kestirimci Bakım: İçinde
Üretimde yapay zeka, sensörler topluyor
titreşim ve sıcaklıkla ilgili yüksek frekanslı veriler. Ham sensör okumalarını doğrudan bir modele beslemek genellikle gürültülüdür
ve etkisizdir. Bunun yerine, mühendisler
gibi özellikler oluşturmak için zaman serisi analizi
"son bir saat içindeki ortalama sıcaklık" veya "titreşim standart sapması". Bunlar
birleştirilmiş özellikler, makine aşınmasını gösteren eğilimleri ve anormallikleri anlık özelliklerden çok daha iyi yakalar
değerler.
İlgili Terimlerden Ayrım
İş akışı tartışmalarında karışıklığı önlemek için özellik mühendisliğini benzer kavramlardan ayırmak yararlı olacaktır.
-
Özellik Mühendisliği ve Özellik Çıkarma: Genellikle birbirinin yerine kullanılsa da, arada bir nüans vardır.
Özellik mühendisliği, aşağıdakilere dayalı olarak yeni girdiler oluşturmaya yönelik manuel, yaratıcı bir süreci ifade eder
alan bilgisi. Tam tersine,
özellik çıkarma genellikle otomatikleştirilmiş
yöntemleri veya yüksek boyutlu verileri yoğun bir temsile dönüştüren matematiksel projeksiyonlar (PCA gibi). İçinde
derin öğrenme (DL), katmanlar
Evrişimsel Sinir Ağları (CNN'ler)
Kenarlar ve dokular için filtreler öğrenerek otomatik özellik çıkarımı gerçekleştirir.
-
Özellik Mühendisliği ve Yerleştirmeler: Modern
doğal dil işleme (NLP), manuel özellik oluşturma (kelime sıklığını sayma gibi) büyük ölçüde yerini
Gömüler. Gömüler yoğun vektörlerdir
Anlamsal anlamı yakalamak için modelin kendisi tarafından öğrenilen temsiller. Gömüler bir özellik biçimi olsa da,
aracılığıyla öğrenilirler
otomatik makine öğrenimi (AutoML)
açıkça elle "tasarlanmış" olmaktan ziyade süreçler.
Geliştiriciler, özellik mühendisliği konusunda uzmanlaşarak yalnızca daha doğru değil aynı zamanda daha verimli modeller oluşturabilir,
Yüksek performans elde etmek için daha az hesaplama gücü gerektirir.