Yeni nesil akıllı bilgi erişim sistemlerinin tasarımında İnternet Madenciliği ve Endüstri Mühendisliği tekniklerinin uygulanması


Özmutlu S. (Yürütücü), Özmutlu H. C.

TÜBİTAK Projesi, 2006 - 2008

  • Proje Türü: TÜBİTAK Projesi
  • Başlama Tarihi: Mayıs 2006
  • Bitiş Tarihi: Nisan 2008

Proje Özeti

Günümüzde İnternet bilgiye erişmek için kullanılan en yaygın araçtır ve milyarlarca siteyi içinde barındırmaktadır. Bu siteler içinde aradığımız konu ile ilgili sayfaları bulmak ise arama motorları ve bilgi erişim sistemleri sayesinde mümkün olmaktadır. İnternet Madenciliği (Web Mining) ise bu geniş bilgi uzayında anlamlı bilgiler edinebilmek için İnternet üzerinde çeşitli metodların kullanılarak veri madenciliği uygulamalarının yapılmasıdır.

 

İnternet Madenciliğinin en güncel konularından biri de akıllı arama motorları ve bilgi erişim sistemlerinin gerçekleştirilmesidir. İnternet’teki web sayfalarının sayısının çok artması sebebi ile arama motorlarında akıllı unsurlar kullanılması bilişim teknolojileri araştırmalarındaki en yeni yönelimlerdendir [1]. İnternet Madenciliğinin arama motorlarına uygulamaları arasında, arama motorlarının kullanıcıyı tanıyarak kullanıcıya uygun hizmeti sunması önem açısından ilk sıralardadır. Bu tarz bir veri madenciliğinin ilk boyutu, veri madenciliği tekniklerinin kullanılarak kullanıcı yapılarının bazı açılardan tahmin edilmesidir. Kullanıcı yapıları akıllı bilgi erişim sistemleri geliştirilmesi yolunda çözülmesi gereken en önemli bilinmeyenlerden biridir. Kullanıcının tanınmasından sonra kullanıcıların hangi konular üzerinde ne kadar zaman harcadıklarına, ne zaman konu değişikliği yaptıklarına dair çalışmalar yapılabilir. Arama motorlarında ve bilgi erişim sistemlerinde kullanıcının anlaşılmasına yönelik akıllı unsurlar şimdiye kadar hiç kullanılmamıştır. Bu işlemi doğal lisan işleme (natural language processing) ile gerçekleştirmek son derece zor bir görev olduğundan bu konuda kayıtlı çok bir çalışma bulunmamaktadır.Fakat optimizasyon, yapay zeka-uzman sistemler ve stokastik-olasılık bazlı Endüstri Mühendisliği teknikleri yukarıda anlatılan veri madenciliği çalışmalarına son derece uygundur. Bu teknikleri kullanarak, kullanıcının bir sonraki aşamada ne yapabileceğini tahmin edebilen akıllı arama motorları ve bilgi erişim sistemlerinin kapıları açılmış olacaktır.  Bu çalışma böyle bir eksikliği doldurarak yeni nesil akıllı arama motorları, bilgi erişim sistemleri ve İnternet Madenciliği uygulamalarına temel teşkil edecektir. Ayrıca yapılacak çalışmanın bilişim teknolojisi ve Endüstri Mühendisliği uygulamalarının ortak noktasında çok önemli bir adım olup, yayın potansiyeli yüksek bir çalışma olacağına inanmaktayız.

                                        

Projede yurtdışından gelmiş olan ve bilgi erişim sistemlerinin kullanımına ait veriler kullanılacaktır. Proje ekibimizde dört adet bilgi erişim sistemine ait veri bulunmaktadır ve bu veriler kullanıcı davranışlarını ve yapısını incelemekte kullanılacaktır. Bu konuda proje ekibi tecrübelidir ve pek çok yayını bulunmaktadır. Bu ön çalışmadan sonra Endüstri Mühendisliği tekniklerini kullanarak kullanıcı davranışlarını tahmin süreci başlayacaktır. Bu konu ile ilgili öncül çalışmalar da yapılmış ve ilk umut verici sonuçlar çeşitli makalelerle yayınlanmıştır [2,3]. Bu sonuçlara örnek olarak, kullanıcıların bilgi erişim sistemini kullanımları esnasında, konu değişiklikleri yapmadan önceki sorguda daha uzun süre kaldıkları tespit edilmiştir. Bu ve bunun gibi sonuçlar doğal lisan işleme gerçekleştirmeden kullanıcının davranış tahminlerini mümkün kılabilmektedir ve kullanıcının davranışlarını kestirebilen akıllı bilgi erişim sistemlerinin oluşturulmasında bir adım olmaktadır. Bu ve bunun gibi daha başarılı sonuçlar için de çalışmaların devam etmesi gerekmektedir. Proje ekibinin bilgi erişim sistemleri verilerinin incelenmesinde tecrübeli oldukları düşünülürse, gerekli çalışmaların yapılması ve yayınların hazırlanıp yollanması için iki yıllık bir sürenini yeterli olacağını düşünülmektedir.