İnternet arama motoru kullanıcı verilerinin analizinde simülasyon ve olasılıksal yöntemlerin uygulanması


Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: Bursa Uludağ Üniversitesi, FEN BİLİMLERİ ENSTİTÜSÜ, Türkiye

Tezin Onay Tarihi: 2009

Tezin Dili: Türkçe

Öğrenci: Buket Büyük

Danışman: SEDA ÖZMUTLU

Özet:

Akıllı bir arama motoru geliştirmenin en önemli adımlarından biri yeni konu tanımlanmasıdır. Yeni konu tanımlanması kullanıcının tek bir oturum sırasında bir konudan diğerine geçerken ki konu değişiminin belirlenmesidir. Bu çalışmada arama motoru kullanıcı oturumlarındaki konu değişikliklerini tespit ve tahmin etmek amaçlanmıştır. Bunun içinde Şartlı Olasılık Yaklaşımı ve Monte Carlo Simülasyonu olmak üzere iki farklı yaklaşım Excite ve FAST arama motorlarından alınan veri setlerinde kullanılmıştır. Bu yaklaşımlarda veri setindeki her bir sorgu için ‘konu değişikliği var’ ve ‘konu değişikliği yok’ diye atamalar yapılmaktadır. Atamaları yapmak içinse sorgunun zaman aralığı ve arama yapısı olmak üzere iki adet istatistiksel özelliği kullanılmaktadır. Yaklaşımlar tarafından yapılan atamalar uzman kişi tarafından yapılan atamalarla karşılaştırılmıştır. Daha sonra yaklaşımların performans ölçütleri hesaplanmış ve incelenmiştir. Şartlı Olasılık yaklaşımı ve Monte-Carlo Simülasyonu yeni konu tanımlaması için yeterli ve tutarlı sonuçlar sağlamıştır.