Sözlük

Özellik Mühendisliği

Uzman özellik mühendisliği ile makine öğrenimi doğruluğunu artırın. Etkili özellikler oluşturma, dönüştürme ve seçme tekniklerini öğrenin.

Özellik mühendisliği, ham verileri seçmek, oluşturmak ve tahmin modellerinin altında yatan sorunu daha iyi temsil eden özelliklere dönüştürmek için alan bilgisini kullanma sürecidir. Özelliklerin kalitesi, ortaya çıkan modelin performansını ve doğruluğunu doğrudan etkilediğinden, makine öğrenimi (ML) boru hattında kritik ve genellikle zaman alan bir adımdır. Etkili özellik mühendisliği, vasat bir model ile son derece doğru bir model arasındaki fark olabilir ve genellikle farklı bir algoritma seçmekten veya kapsamlı hiperparametre ayarlamasından daha önemli performans kazanımları sağlar.

## Özellik Mühendisliği Süreci

Özellik mühendisliği, alan uzmanlığını matematiksel tekniklerle harmanlayan hem bir sanat hem de bir bilimdir. Süreç, genellikle scikit-learn'in ön işleme modülü gibi kütüphaneler veya otomatik özellik mühendisliği için özel araçlar kullanılarak yönetilen birkaç ortak faaliyete ayrılabilir.

  • Özellik Oluşturma: Bu, mevcut özelliklerden yeni özellikler oluşturmayı içerir. Örneğin, bir perakende veri kümesinde, "müşteri sadakat süresi" özelliği oluşturmak için "müşteriden beri" tarihinden "satın alma tarihini" çıkarabilirsiniz. Zaman serisi analizinde, bir zaman damgasından hareketli ortalamalar veya mevsimsellik gibi özellikler türetebilirsiniz.
  • Dönüşümler: Ham verilerin genellikle bir makine öğrenimi algoritmasının varsayımlarını karşılamak için dönüştürülmesi gerekir. Bu, sayısal özelliklerin ölçeklendirilmesini, çarpık verileri işlemek için logaritmik dönüşümlerin uygulanmasını veya sayıları kategoriler halinde gruplamak için gruplama gibi tekniklerin kullanılmasını içerir.
  • Kodlama: Birçok makine öğrenimi modeli kategorik verileri doğrudan işleyemez. Kodlama, metin tabanlı kategorilerin sayısal temsillere dönüştürülmesini içerir. Yaygın yöntemler arasında her kategori değerinin yeni bir ikili sütuna dönüştürüldüğü tek vuruşlu kodlama ve etiket kodlaması yer alır.
  • Özellik Seçimi: Tüm özellikler kullanışlı değildir. Bazıları gereksiz veya alakasız olabilir ve aşırı uyuma yol açabilecek gürültüye neden olabilir. Özellik seçimi, model performansını iyileştirmek ve hesaplama maliyetini azaltmak için en alakalı özelliklerin bir alt kümesini seçmeyi amaçlar.

## Gerçek Dünya Uygulamaları

Özellik mühendisliğinin etkisi birçok sektörde açıkça görülmektedir. Etkinliği genellikle, öngörücü sinyalleri gerçekten yakalayan özellikler oluşturmak için derin alan bilgisine dayanır.

  1. Kredi Puanlaması: Finans alanında, ham müşteri verileri gelir, yaş ve kredi geçmişini içerebilir. Bir özellik mühendisi "borç-gelir oranı" (toplam borcun brüt gelire bölünmesi) veya "kredi kullanımı" (kredi kartı bakiyesinin kredi limitine bölünmesi) gibi yeni değişkenler yaratabilir. Bu mühendislik özellikleri, bir kişinin finansal sağlığı hakkında tek başına ham rakamlardan çok daha net bir sinyal sağlayarak daha doğru kredi riski modellerine yol açar.
  2. Kestirimci Bakım: Üretimde, makinelerdeki sensörler titreşim, sıcaklık ve dönüş hızı gibi çok sayıda ham veri akışı üretir. Arızaları tahmin etmek için bir mühendis "son 24 saatteki sıcaklık ortalaması" veya "titreşimin standart sapması" gibi özellikler oluşturabilir. Bu özellikler, mekanik bir arızadan önce gelen ince bozulma modellerini ortaya çıkararak proaktif bakım yapılmasını sağlayabilir ve maliyetli arıza sürelerini önleyebilir.

## Özellik Mühendisliği ve İlgili Kavramlar

Özellik mühendisliğini yapay zeka ve veri bilimindeki ilgili terimlerden ayırmak önemlidir.

  • Özellik Mühendisliği ve Özellik Çıkarma: Özellik mühendisliği, sezgi ve uzmanlığa dayalı olarak yeni özellikler oluşturmaya yönelik büyük ölçüde manuel bir süreçtir. Özellik çıkarma ise tipik olarak verileri indirgenmiş bir özellik kümesine dönüştüren otomatik bir süreçtir. Derin öğrenmede, Evrişimsel Sinir Ağları (CNN'ler) gibi modeller, insan müdahalesi olmadan ham piksel verilerinden hiyerarşik özellikleri (kenarlar, dokular, şekiller) öğrenerek otomatik olarak özellik çıkarımı gerçekleştirir.
  • Özellik Mühendisliği ve Gömüler: Gömmeler, NLP ve bilgisayarla görmede yaygın olan gelişmiş, öğrenilmiş bir özellik temsili biçimidir. Manuel olarak özellik oluşturmak yerine, bir model bir öğenin (bir kelime veya görüntü gibi) anlamsal anlamını yakalayan yoğun bir vektör öğrenir. Bu nedenle, katıştırmalar manuel mühendisliğin değil, otomatik özellik öğrenmenin bir sonucudur.
  • Özellik Mühendisliği ve Veri Önişleme: Veri ön işleme, temel adımlarından biri olarak özellik mühendisliğini içeren daha geniş bir kategoridir. Ayrıca veri temizleme (eksik değerlerin ve aykırı değerlerin ele alınması) ve veri kümelerinin eğitim için hazırlanması gibi diğer temel görevleri de kapsar.

Ultralytics YOLO modellerindeki gibi modern mimariler, nesne algılama ve örnek segmentasyonu gibi görüntü tabanlı görevler için özellik çıkarımını otomatikleştirirken, özellik mühendisliği ilkeleri temel olmaya devam etmektedir. Verilerin nasıl etkili bir şekilde temsil edileceğini anlamak, modellerde hata ayıklama yapmak, veri kalitesini artırmak ve görsel verileri yapılandırılmış verilerle birleştirmeyi içeren karmaşık sorunların üstesinden gelmek için çok önemlidir. Ultralytics HUB gibi platformlar, veri kümesi hazırlığından model dağıtımına kadar tüm bu yaşam döngüsünü yönetmek için araçlar sağlar.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve büyüyün

Şimdi katılın
Panoya kopyalanan bağlantı