YOLO26 ile tanış: yeni nesil görsel AI.
Ultralytics
Ultralytics Sözlüğüne dön

Speech Recognition

Konuşma tanımanın (ASR) konuşulan dili metne nasıl dönüştürdüğünü keşfet. Sinir ağları, gerçek dünya yapay zeka uygulamaları ve çok modlu Ultralytics YOLO26 hakkında bilgi edin.

Teknik olarak Otomatik Konuşma Tanıma (ASR) olarak da bilinen konuşma tanıma, bir bilgisayarın konuşulan dili tanımlamasını, işlemesini ve yazılı metne dökmesini sağlayan özel bir yetenektir. Bu teknoloji, Yapay Zeka (AI) sistemlerinin yalnızca klavye veya dokunmatik ekranlara güvenmek yerine sesli komutları girdi olarak kabul etmesini sağlayarak insan-bilgisayar etkileşiminde hayati bir köprü görevi görür. Ses dalga biçimlerini analiz edip bunları geniş dil veri kümeleriyle eşleştirerek, bu sistemler farklı aksanları, değişen konuşma hızlarını ve karmaşık kelime dağarcıklarını yorumlayabilir. Bu süreç, yapılandırılmamış sesi yapılandırılmış, makine tarafından okunabilir verilere dönüştüren modern Doğal Dil İşleme (NLP) iş akışlarının temel bir bileşenidir.

Link to this sectionKonuşma Tanıma Nasıl Çalışır#

Konuşma tanımanın arkasındaki mimari, basit şablon eşleştirmeden Derin Öğrenme (DL) ile desteklenen gelişmiş işlem hatlarına evrilmiştir. Süreç genellikle kritik adımlardan oluşan bir diziyi takip eder. İlk olarak, ham analog ses yakalanır ve dijitalleştirilir. Sistem daha sonra arka plan gürültüsünü filtrelemek ve fonetik özellikleri izole etmek için özellik çıkarımı gerçekleştirir ve sesi genellikle frekans yoğunluğunu zaman içinde haritalamak için bir spektrogram olarak görselleştirir.

Once the audio features are isolated, an acoustic model comes into play. This model, often built using a Neural Network (NN) such as a Recurrent Neural Network (RNN) or a modern Transformer, maps the acoustic signals to phonemes—the basic units of sound. Finally, a language model analyzes the sequence of phonemes to predict the most probable words and sentences. This step is crucial for distinguishing between homophones (like "to," "two," and "too") based on context. Developers utilize frameworks like PyTorch to train these data-intensive models.

Link to this sectionGerçek Dünya Uygulamaları#

Konuşma tanıma artık her yerde mevcuttur ve birçok sektörde verimliliği ve erişilebilirliği artırmaktadır.

  • Sağlık Hizmetleri Dokümantasyonu: Tıp alanında, sağlık hizmetlerinde AI, doktorların Nuance Communications gibi sağlayıcıların özel araçlarını kullanarak klinik notlarını doğrudan Elektronik Sağlık Kayıtlarına (EHR) dikte etmelerine olanak tanır. Bu, idari iş yükünü önemli ölçüde azaltır ve veri doğruluğunu artırır.
  • Otomotiv Arayüzleri: Modern araçlar, sürücülerin navigasyon ve eğlence sistemlerini eller serbest şekilde yönetmelerine olanak tanımak için sesli kontrolü entegre eder. Otomotivde AI, bu güvenilir sesli arayüzler aracılığıyla görsel dikkat dağınıklığını en aza indirerek güvenliğe öncelik verir.
  • Sanal Asistanlar: Apple'ın Siri'si gibi tüketici odaklı asistanlar, zamanlayıcı ayarlamaktan akıllı ev cihazlarını kontrol etmeye kadar değişen görevler için komutları ayrıştırmak amacıyla ASR kullanır ve bir Sanal Asistan için birincil girdi katmanı görevi görür.

Link to this sectionİlgili Terimlerin Ayrıştırılması#

Genellikle günlük dilde aynı anlama gelmek üzere kullanılsa da, konuşma tanımayı AI sözlüğündeki ilgili kavramlardan ayırt etmek önemlidir.

  • Konuşmadan Metne (STT): STT özel olarak çıktı işlevine (sesin metne dönüştürülmesi) atıfta bulunurken, konuşma tanıma sesin tanımlanmasına yönelik daha geniş teknolojik metodolojiyi kapsar.
  • Doğal Dil Anlama (NLU): ASR sesi metne dönüştürür ancak mesajı doğası gereği "anlamaz". NLU, yazıya dökülen kelimelerin arkasındaki niyeti, duyguyu ve anlamı yorumlayan bir sonraki aşama sürecidir.
  • Metinden Konuşmaya (TTS): Bu, sistemin yazılı metinden yapay, insan benzeri konuşma sentezlediği ters işlemdir.

Link to this sectionBilgisayarlı Görü ile Entegrasyon#

Akıllı sistemlerin bir sonraki sınırı, işitsel ve görsel verileri birleştiren Çok Modlu Öğrenme alanıdır. Örneğin, bir servis robotu bir odadaki belirli bir kullanıcıyı bulmak için YOLO26 ile gerçek zamanlı nesne algılama kullanırken, aynı anda "bana su şişesini getir" gibi bir komutu anlamak için konuşma tanımayı kullanabilir. Bu yakınsama, hem görebilen hem de duyabilen kapsamlı AI temsilcileri oluşturur. Ultralytics Platform, bu karmaşık veri kümelerinin yönetimini ve bu tür çok modlu uygulamalar için sağlam modellerin eğitilmesini kolaylaştırır.

Aşağıdaki Python örneği, bir ses dosyasını yazıya dökmek için popüler bir sarıcı araç olan SpeechRecognition kütüphanesinin nasıl kullanılacağını göstermektedir.

import speech_recognition as sr

# Initialize the recognizer class
recognizer = sr.Recognizer()

# Load an audio file (supports WAV, AIFF, FLAC)
# Ideally, this audio file contains clear, spoken English
with sr.AudioFile("user_command.wav") as source:
    audio_data = recognizer.record(source)  # Read the entire audio file

try:
    # Transcribe the audio using Google's public speech recognition API
    text = recognizer.recognize_google(audio_data)
    print(f"Transcribed Text: {text}")
except sr.UnknownValueError:
    print("System could not understand the audio")

Sistem performansı tipik olarak, daha düşük bir puanın daha yüksek doğruluğu gösterdiği Kelime Hata Oranı (WER) metriği kullanılarak değerlendirilir. Bu teknolojilerin görüntü modelleriyle birlikte nasıl çalıştığına dair daha fazla bilgi için NLP ile Bilgisayarlı Görü arasında köprü kurma hakkındaki rehberimizi inceleyin.

Explore solutions

Real-time AI that works with your team

Robotikte AI

Daha akıllı makineleri Ultralytics YOLO modelleriyle destekle. Robotikteki Vision AI; otonom navigasyonu, algılamayı, nesne takibini ve gerçek zamanlı kontrolü yönlendirir.

Daha fazla bilgi edin
Real-time AI that works with your team

Lojistikte Yapay Zeka

Ultralytics YOLO modelleri ile lojistiği kolaylaştır. Görü Yapay Zekası; paket inceleme, ayıklama, araç takibi ve gerçek zamanlı depo güvenliği izlemeyi mümkün kılar.

Daha fazla bilgi edin
Real-time AI that works with your team

Perakendede AI

Perakendeyi Ultralytics YOLO modelleri ile yeniden hayal et. Görü Yapay Zekası; envanter takibi, raf izleme, sıra yönetimi ve daha akıllı müşteri içgörüleri sağlar.

Daha fazla bilgi edin
Real-time AI that works with your team

Sağlıkta Yapay Zeka

Ultralytics YOLO modelleriyle sağlık çözümleri oluştur. Sağlıkta görüntü tabanlı yapay zeka; daha hızlı tıbbi görüntülemeyi, daha akıllı teşhisleri ve hasta izlemeyi güçlendirir.

Daha fazla bilgi edin
Real-time AI that works with your team

Üretimde Yapay Zeka

Ultralytics YOLO modelleri ile üretimi optimize et. Görü Yapay Zekası; kalite kontrol, kusur tespiti, KKD uyumu ve montaj hattı otomasyonunu yönlendirir.

Daha fazla bilgi edin
Real-time AI that works with your operation

Otomotivde yapay zeka

Ultralytics YOLO modelleriyle otomotivde bilgisayarlı görü uygula. Görüntü tabanlı yapay zeka; yol güvenliğini, sürücü yardımını ve araç otomasyonunu daha akıllı yollar için geliştirir.

Daha fazla bilgi edin
Real-time AI tailored to your operation

Tarımda yapay zeka

Ultralytics YOLO modelleriyle akıllı tarıma görüntü tabanlı yapay zeka getir. Daha yüksek ve akıllı verimler için mahsul takibini, hayvancılık izlemeyi ve hassas tarımı güçlendir.

Daha fazla bilgi edin
Real-time AI that works with your team

Robotikte AI

Daha akıllı makineleri Ultralytics YOLO modelleriyle destekle. Robotikteki Vision AI; otonom navigasyonu, algılamayı, nesne takibini ve gerçek zamanlı kontrolü yönlendirir.

Daha fazla bilgi edin
Real-time AI that works with your team

Lojistikte Yapay Zeka

Ultralytics YOLO modelleri ile lojistiği kolaylaştır. Görü Yapay Zekası; paket inceleme, ayıklama, araç takibi ve gerçek zamanlı depo güvenliği izlemeyi mümkün kılar.

Daha fazla bilgi edin
Real-time AI that works with your team

Perakendede AI

Perakendeyi Ultralytics YOLO modelleri ile yeniden hayal et. Görü Yapay Zekası; envanter takibi, raf izleme, sıra yönetimi ve daha akıllı müşteri içgörüleri sağlar.

Daha fazla bilgi edin
Real-time AI that works with your team

Sağlıkta Yapay Zeka

Ultralytics YOLO modelleriyle sağlık çözümleri oluştur. Sağlıkta görüntü tabanlı yapay zeka; daha hızlı tıbbi görüntülemeyi, daha akıllı teşhisleri ve hasta izlemeyi güçlendirir.

Daha fazla bilgi edin
Real-time AI that works with your team

Üretimde Yapay Zeka

Ultralytics YOLO modelleri ile üretimi optimize et. Görü Yapay Zekası; kalite kontrol, kusur tespiti, KKD uyumu ve montaj hattı otomasyonunu yönlendirir.

Daha fazla bilgi edin
Real-time AI that works with your operation

Otomotivde yapay zeka

Ultralytics YOLO modelleriyle otomotivde bilgisayarlı görü uygula. Görüntü tabanlı yapay zeka; yol güvenliğini, sürücü yardımını ve araç otomasyonunu daha akıllı yollar için geliştirir.

Daha fazla bilgi edin
Real-time AI tailored to your operation

Tarımda yapay zeka

Ultralytics YOLO modelleriyle akıllı tarıma görüntü tabanlı yapay zeka getir. Daha yüksek ve akıllı verimler için mahsul takibini, hayvancılık izlemeyi ve hassas tarımı güçlendir.

Daha fazla bilgi edin
Real-time AI that works with your team

Robotikte AI

Daha akıllı makineleri Ultralytics YOLO modelleriyle destekle. Robotikteki Vision AI; otonom navigasyonu, algılamayı, nesne takibini ve gerçek zamanlı kontrolü yönlendirir.

Daha fazla bilgi edin
Real-time AI that works with your team

Lojistikte Yapay Zeka

Ultralytics YOLO modelleri ile lojistiği kolaylaştır. Görü Yapay Zekası; paket inceleme, ayıklama, araç takibi ve gerçek zamanlı depo güvenliği izlemeyi mümkün kılar.

Daha fazla bilgi edin
Real-time AI that works with your team

Perakendede AI

Perakendeyi Ultralytics YOLO modelleri ile yeniden hayal et. Görü Yapay Zekası; envanter takibi, raf izleme, sıra yönetimi ve daha akıllı müşteri içgörüleri sağlar.

Daha fazla bilgi edin
Real-time AI that works with your team

Sağlıkta Yapay Zeka

Ultralytics YOLO modelleriyle sağlık çözümleri oluştur. Sağlıkta görüntü tabanlı yapay zeka; daha hızlı tıbbi görüntülemeyi, daha akıllı teşhisleri ve hasta izlemeyi güçlendirir.

Daha fazla bilgi edin
Real-time AI that works with your team

Üretimde Yapay Zeka

Ultralytics YOLO modelleri ile üretimi optimize et. Görü Yapay Zekası; kalite kontrol, kusur tespiti, KKD uyumu ve montaj hattı otomasyonunu yönlendirir.

Daha fazla bilgi edin
Real-time AI that works with your operation

Otomotivde yapay zeka

Ultralytics YOLO modelleriyle otomotivde bilgisayarlı görü uygula. Görüntü tabanlı yapay zeka; yol güvenliğini, sürücü yardımını ve araç otomasyonunu daha akıllı yollar için geliştirir.

Daha fazla bilgi edin
Real-time AI tailored to your operation

Tarımda yapay zeka

Ultralytics YOLO modelleriyle akıllı tarıma görüntü tabanlı yapay zeka getir. Daha yüksek ve akıllı verimler için mahsul takibini, hayvancılık izlemeyi ve hassas tarımı güçlendir.

Daha fazla bilgi edin

Yapay zekanın geleceğini birlikte inşa edelim!

Yolculuğuna makine öğreniminin geleceğiyle başla