Tezin Türü: Yüksek Lisans
Tezin Yürütüldüğü Kurum: Uludağ Üniversitesi, Türkiye
Tezin Onay Tarihi: 2000
Tezin Dili: Türkçe
Öğrenci: ÖMER ESKİDERE
Danışman: FİGEN ERTAŞ
Özet:İnsanın ses üretme mekanizmasının modellenmesi, konuşma işaretlerinin doğasını anlamaya yardımcı olduğu kadar ses üretiminde de doğrudan gereklidir. Elektronik olarak modellenebilen konuşma üretim işlemi pratikte ses sentezleyici olarak kullanılabilir. Rezonans sistemini ses yolu benzetimi ile modelleyen sistemler, formant frekansları için ayrı ayrı rezonatörler kullanır. Bu rezonatörlerin bağlanış şekillerine göre sentezleyici kaskat yada paralel formant sentezleyici olarak adlandırılır. Bu tezde formant sentezleme tekniğine dayanan bir Türkçe sözcük sentezleyici geliştirilmiştir. Sentezleyici normalde kaskat/paralel modunda çalışmasına rağmen, sadece bir anahtar yardımı ile, alternatif olarak gerektiğinde paralel modda kullanılabilir. Kullandığımız sözcük sentezleyicinin en önemli özelliği önceden kaydedilmiş konuşma örneklerine ihtiyaç duymadan doğrudan ses yolu modeli ile yapay insan sesi üretmesidir. Her bir ses, 20'si değişken ve 19'u sabit olmak üzere 39 parametre ile karakterize edilmiştir. Programdaki formant frekansları, formant band genişlikleri, temel frekans, vb. gibi değişken kontrol parametreleri kullanıcı tarafından belirlenir. Bu projedeki sabit parametreler belirli bir erkek sesi için uygun olarak seçilmiştir, farklı erkek veya kadın sesleri parametrelerde değişiklikler yapılarak elde edilebilir. Yeterli hafıza ve donanıma sahip kişisel bir bilgisayar ortamında çalışabilen esnek bir yazılım tabanlı sentezleyici tanıtılmıştır. Sentezleyici ile elde edilen değişik kelimelerin, yapay konuşmaya alışkın olmayan eğitilmemiş kişiler ile gerçeklenen anlaşılabilirlik testi göstermiştir ki, sesli harfler sesiz harflere göre daha doğru olarak belirlenmişlerdir.