UC Berkeley ve UC San Francisco’dan araştırmacılar, ağır felç geçiren bireyler için neredeyse doğal konuşmayı geri kazandıran bir sistem geliştirerek beyin-bilgisayar arayüzü (BCI) teknolojisinde çığır açtılar. Bu yenilikçi yöntem, konuşma nöroprotezlerindeki temel bir sorunu çözmeye odaklanıyor: Konuşma girişimleri ile düşüncelerin sese dönüştürülmesi arasındaki gecikmenin ortadan kaldırılması.
Nature Neuroscience dergisinde yayınlanan bu teknoloji, beyin sinyallerini neredeyse anında konuşulan kelimelere çevirmek için yapay zeka (AI) kullanıyor. Gerçek zamanlı olarak duyulabilir konuşmaya aktarılan beyin aktiviteleri, konuşmayı daha doğal ve akıcı hale getirerek duraklama olmadan sürekli bir ifade akışı sağlıyor. Bu öncü çalışma, Ulusal Sağlık Enstitüleri (NIH) bünyesindeki Ulusal Sağırlık ve Diğer İletişim Bozuklukları Enstitüsü (NIDCD) tarafından destekleniyor.
Alexa ve Siri gibi cihazlarda kullanılan algoritmalara benzer bir yapıya sahip olan bu sistem, sinyalleri çözerek konuşma oluşturan bir akış sunuyor. Çeşitli cihazlarla uyumlu olan teknoloji, hem invaziv olmayan sensörlerle yüz kası aktivitesini ölçebiliyor hem de beynin yüzeyine veya içine yerleştirilen elektrotlarla daha karmaşık sistemleri destekleyebiliyor. Doktora öğrencisi ve çalışmanın ortak yazarı Kaylo Littlejohn’a göre algoritma, güvenilir sinyallere erişim sağlandığında farklı beyin izleme düzeneklerine kolayca uyum sağlayabiliyor.
Nasıl çalışıyor?
Bu nöroprotez, beynin motor korteksinde konuşmayı kontrol eden sinirsel aktiviteleri algılayarak kelimelere dönüştürüyor. Bu süreç, birey bir düşünce oluşturduğunda ve ses kaslarını hareket ettirmeye hazırlandığında devreye giriyor. Sistemin eğitimi için araştırmacılar, katılımcının sessizce cümleler söylemeye çalıştığı anlarda beyin aktivitelerini kaydetti. Yapay zeka modelleri, eksik ses detaylarını doldurarak konuşma çıktısını oluşturdu. Ayrıca ekip, katılımcının yaralanmadan önceki sesini referans alarak çıktının tanıdık ve kişisel olmasını sağladı. Önceki teknolojiler, tam cümlelerin çözümlenmesinde 8 saniyelik bir gecikmeye sahipken, bu yeni yöntem 1 saniyeden kısa sürede duyulabilir konuşma oluşturabiliyor. Bu hız ve doğruluk, sistemin gerçek zamanlı konuşma üretiminde üstün bir performans sergilediğini kanıtlıyor.
Araştırmacılar, sistemi test etmek için NATO fonetik alfabesindeki (“Alfa”, “Bravo” gibi) nadir kelimeleri sentezlediler ve bu kelimeler, eğitim verilerinin bir parçası olmadığı halde başarılı sonuçlar elde edildi. Bu durum, teknolojinin daha geniş bir kelime dağarcığında kullanılabileceğini gösteriyor.
Gelecek vizyonu
Araştırma ekibi, gelecekte konuşmanın duygusal tonunu ve ifade gücünü artırmayı hedefliyor. Çıkışı daha gerçekçi hale getirmek için perde, ses düzeyi ve duygusal değişiklikleri yansıtacak şekilde sistemi geliştirmeyi amaçlıyorlar. Bu teknoloji, daha fazla iyileştirme ile konuşma yetisini kaybetmiş bireyler için iletişim seçeneklerini önemli ölçüde genişletebilir ve hayat kalitesini artırabilir.
0 Comments