Kenan Donuk scite author profile

Konuşma duygu tanıma, konuşma sinyallerinden insan duygularını gerçek zamanlı olarak tanıyabilen aktif bir insan-bilgisayar etkileşimi alanıdır. Bu alanda yapılan tanıma görevi, duyguların karmaşıklığı nedeniyle zorlu bir sınıflandırma örneğidir. Etkili bir sınıflandırma işleminin yapılabilmesi yüksek seviyeli derin özelliklere ve uygun bir derin öğrenme modeline bağlıdır. Konuşma duygu tanıma alanında yapılmış birçok sınıflandırma çalışması mevcuttur. Bu çalışmalarda konuşma verilerinden duyguların doğru bir şekilde çıkarılması için birçok farklı model ve özellik birleşimi önerilmiştir. Bu makalede konuşma duygu tanıma görevi için bir sistem önerilmektedir. Bu sistemde konuşma duygu tanıma için uzun-kısa süreli bellek tabanlı bir derin öğrenme modeli önerilmiştir. Önerilen sistem ön-işlem, özellik çıkarma, özellik birleşimi, uzun-kısa süreli bellek ve sınıflandırma olmak üzere dört aşamadan oluşmaktadır. Önerilen sistemde konuşma verilerine ilk olarak kırpma ve ön-vurgu ön-işlemleri uygulanır. Bu işlemlerden sonra elde edilen konuşma verilerinden Mel Frekans Kepstrum Katsayıları, Sıfır Geçiş Oranı ve Kök Ortalama Kare Enerji akustik özellikleri çıkarılarak birleştirilir. Birleştirilen bu özelliklerin uzamsal bilgilerinin yanında zaman içindeki akustik değişimleri sistemde önerilen uzun-kısa süreli bellek ve buna bağlı bir derin sinir ağı modeliyle öğrenilir. Son olarak softmax aktivasyon fonksiyonu ile öğrenilen bilgiler 8 farklı duyguya sınıflandırılır. Önerilen sistem RAVDESS ve TESS veri setlerinin birlikte kullanıldığı bir veri kümesinde test edilmiştir. Eğitim, doğrulama ve test sonuçlarında sırasıyla %99.87 , %85.14 , %88.92 oranlarında doğruluklar ölçülmüştür. Sonuçlar, son teknoloji çalışmalardaki doğruluklarla kıyaslanmış önerilen sistemin başarısı ortaya konmuştur.

show abstract

Mini U-Net Tabanlı Göz bebeği Merkezi Yerelleştirmesi

Donuk

Hanbay

2022

BBD

View full text Add to dashboard Cite

Göz takip algoritmalarında önemli bir yere sahip olan göz bebeği merkezinin yerini belirlemek için geçmişten günümüze birçok yöntem kullanılmıştır. Bu yöntemler genellikle şekil-özellik ve görünüm temellidir. Şekil-özellik tabanlı yöntemler, iris ve göz bebeğinin yerini belirlemek için morfolojik görüntü işleme tekniklerini, gözün değişmez geometrik özelliklerini ve kızılötesi ışığı kullanır. Bu yöntemler ışık, düşük çözünürlük gibi gerçek dünya koşullarından etkilenir. Buna karşılık, görünüm temelli yöntemler bu koşullara daha az duyarlıdır. Bu çalışmada, göz özelliklerini otomatik olarak öğrenen ve göz bebeği merkezi lokalizasyonu gerçekleştiren görünüm tabanlı yöntemlerden biri olan Mini U-Net ağı önerilmiştir. Önerilen ağ, göz bebeği merkezi yerelleştirmesi için halka açık GI4E veri seti kullanılarak değerlendirildi. Ağın test sonuçlarında maksimum normalize edilmiş hata kriterine göre ölçümler yapılmıştır. Buna göre göz bebeğinin merkezi %98,40 doğrulukla belirlendi. Önerilen ağ, en son teknolojik yöntemlerle karşılaştırılmış ve önerilen ağın performansı ortaya konmuştur.

show abstract

scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.

Contact Info

customersupport@researchsolutions.com

10624 S. Eastern Ave., Ste. A-614

Henderson, NV 89052, USA

This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.

Blog Terms and Conditions API Terms Privacy Policy Contact Cookie Preferences Do Not Sell or Share My Personal Information

Made with 💙 for researchers

Part of the Research Solutions Family.

Kenan Donuk

BPSO ve SVM'ye Dayalı Yüzde Duygu Tanıma için Derin Özellik Seçimi

A CNN based real-time eye tracker for web mining applications

Investigation of PIDA Controller Parameters via PSO Algorithm

Konuşma Duygu Tanıma için Akustik Özelliklere Dayalı LSTM Tabanlı Bir Yaklaşım

Mini U-Net Tabanlı Göz bebeği Merkezi Yerelleştirmesi

Contact Info

Product

Resources

About