Basit öğe kaydını göster

dc.contributor.advisorErbay, Hasan
dc.contributor.authorDuman, Elvan
dc.date.accessioned2021-01-16T19:12:49Z
dc.date.available2021-01-16T19:12:49Z
dc.date.issued2013
dc.identifier.urihttps://hdl.handle.net/20.500.12587/17057
dc.descriptionYÖK Tez ID: 344009en_US
dc.description.abstractBilgisayar ve ağ teknolojisinin hızlı gelişimi İnternet?in popülaritesini arttırmaktadır. İnternet üzerindeki bilgi miktarının devasa artışı ve web sayfalarının barındırdığı gürültülü bilginin çeşitliliği nedeniyle web sayfalarının içerik sınıflandırması doğal metin sınıflandırmasına göre daha karmaşık ve zordur. Geleneksel bilgi alma metotları dokümanların sınıflandırılabilmesi için terimlerin doküman içerisinde bulunmasını kullanır fakat bunun sonucunda genellikle ilgisiz web sayfaları sonuç olarak döndürülür. Bu çalışmada, web sayfalarını etkili bir şekilde sınıflandırabilmek için Gizli Anlam Analiz temelli otomatik web sayfası sınıflandırma algoritması geliştirilmiştir. Algoritmanın son aşamasında Destek Vektör Makinesi yardımıyla sınıfları birbirinden ayıran eğri çizilmiştir. Ayrıca başarı ve performansı etkileyen terim ağırlıklandırma ve özellik uzayının yüksek boyutluluk problemine çözüm sağlayan özellik seçim yöntemleri üzerinde çalışılmıştır. Deneysel sonuçlar önerilen sınıflandırma algoritmasının etkinliğini göstermiştir ve dokümanların iyi temsil edildiği bir terim - doküman matrisinin sınıflandırma performansını geliştirdiğini saptamıştır.en_US
dc.description.abstractThe fast development on the computer and network technology has increased the popularity of Web. Due to the gigantic increase in the amount of information on the web and a large variety of noisy information embedded in Web pages, Web page classification is getting more sophisticated and difficult than pure-text classification. Traditional information retrieval methods use terms occurring in document to determine the class of the document, but the retrieve usually results in unrelated web pages. In this study, Latent Semantic Analysis based automatic web page classification algorithm developed in order to effectively classify web pages. The curve separates the document classes plotted by the Support Vector Machine in the final step of the algorithm. We also study on the feature weighting and the feature selection methods which are used to reduce the size of the feature space. The experimental results demonstrate that the proposed classification algorithm robust and effectively classify the documents, moreover, the results demonstrate that the better the representation of the documents by term - document matrix results in the better classification.en_US
dc.language.isoturen_US
dc.publisherKırıkkale Üniversitesien_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.subjectBilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolen_US
dc.subjectComputer Engineering and Computer Science and Controlen_US
dc.titleWeb sayfalarının gizli anlam analizi yaklaşımıyla otomatik olarak sınıflandırılmasıen_US
dc.title.alternativeLatent semantic analysis approach for automatic classification of web pages contentsen_US
dc.typemasterThesisen_US
dc.contributor.departmentKKÜ, Fen Bilimleri Enstitüsü, Bilgisayar Mühendisliği Anabilim Dalıen_US
dc.identifier.startpage1en_US
dc.identifier.endpage80en_US
dc.relation.publicationcategoryTezen_US


Bu öğenin dosyaları:

Thumbnail

Bu öğe aşağıdaki koleksiyon(lar)da görünmektedir.

Basit öğe kaydını göster