Yazılım tabanlı söz sentezleyici tasarımı


Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: Uludağ Üniversitesi, Türkiye

Tezin Onay Tarihi: 2000

Tezin Dili: Türkçe

Öğrenci: ÖMER ESKİDERE

Danışman: FİGEN ERTAŞ

Özet:

İnsanın ses üretme mekanizmasının modellenmesi, konuşma işaretlerinin doğasını anlamaya yardımcı olduğu kadar ses üretiminde de doğrudan gereklidir. Elektronik olarak modellenebilen konuşma üretim işlemi pratikte ses sentezleyici olarak kullanılabilir. Rezonans sistemini ses yolu benzetimi ile modelleyen sistemler, formant frekansları için ayrı ayrı rezonatörler kullanır. Bu rezonatörlerin bağlanış şekillerine göre sentezleyici kaskat yada paralel formant sentezleyici olarak adlandırılır. Bu tezde formant sentezleme tekniğine dayanan bir Türkçe sözcük sentezleyici geliştirilmiştir. Sentezleyici normalde kaskat/paralel modunda çalışmasına rağmen, sadece bir anahtar yardımı ile, alternatif olarak gerektiğinde paralel modda kullanılabilir. Kullandığımız sözcük sentezleyicinin en önemli özelliği önceden kaydedilmiş konuşma örneklerine ihtiyaç duymadan doğrudan ses yolu modeli ile yapay insan sesi üretmesidir. Her bir ses, 20'si değişken ve 19'u sabit olmak üzere 39 parametre ile karakterize edilmiştir. Programdaki formant frekansları, formant band genişlikleri, temel frekans, vb. gibi değişken kontrol parametreleri kullanıcı tarafından belirlenir. Bu projedeki sabit parametreler belirli bir erkek sesi için uygun olarak seçilmiştir, farklı erkek veya kadın sesleri parametrelerde değişiklikler yapılarak elde edilebilir. Yeterli hafıza ve donanıma sahip kişisel bir bilgisayar ortamında çalışabilen esnek bir yazılım tabanlı sentezleyici tanıtılmıştır. Sentezleyici ile elde edilen değişik kelimelerin, yapay konuşmaya alışkın olmayan eğitilmemiş kişiler ile gerçeklenen anlaşılabilirlik testi göstermiştir ki, sesli harfler sesiz harflere göre daha doğru olarak belirlenmişlerdir.