Yapay sinir ağları ile konuşmacı tanıma


Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: Uludağ Üniversitesi, Türkiye

Tezin Onay Tarihi: 2007

Tezin Dili: Türkçe

Öğrenci: SÜHEYLA BAŞARAN

Danışman: FİGEN ERTAŞ

Özet:

Bu çalışmada TIMIT veri tabanından alınan bir test öbeği üzerinde Yapay Sinir Ağları ve geri yayılım algoritmaları kullanılarak metinden bağımsız konuşmacı tanıma uygulamaları geliştirilmiştir. Konuşmacı tanıma aşamasından önce kişilere ait ses işaretlerinin Mel Frekansı Kepstrum Katsayıları (MFCC) çıkarılarak özellik vektörleri kümesi oluşturulmuştur. Daha sonra özellik vektörlerinin boyutlarındaki büyüklük problemini çözmek amacıyla özellik vektörlerini Vektör Nicemleme işleminden geçirilmiştir. Konuşmacı tanıma işleminde geriye yayılım algoritması ve yapay sinir ağları ile verilen konuşma örneğinden konuşmacının kim olduğunu tespit etmeye çalışılmıştır. MFCC katsayıları, Vektör Nicemleme adımları, geriye yayılım algoritması ve yapay sinir ağ yapılarında çeşitli parametrelerin değişmesinin konuşmacı tanıma üzerindeki etkisi incelenmiştir.