Yazar "Atasever, Sema" seçeneğine göre listele
Listeleniyor 1 - 1 / 1
Sayfa Başına Sonuç
Sıralama seçenekleri
Öğe Kümelenmiş protein dizileri kullanarak yapısal özellik tahmini yapan yöntemlere özellik vektörü tasarlamak(Kırıkkale Üniversitesi, 2019) Atasever, Sema; Erbay, Hasan; Aydın, ZaferProtein yapıları ve fonksiyonları için her yıl büyük miktarlarda veri üretilmektedir. Elde edilen bu bilgilerin oluşturduğu protein veri tabanları modern biyolojinin önemli bir parçasıdır. Boyutları sürekli olarak artan bu büyük boyutlu veri tabanları ile Destek Vektör Makinesi (SVM) eğitimi karesel optimizasyon nedeniyle uzun zaman almaktadır. Bu problem durumu ile başa çıkabilmek için bu tez çalışmasında, tahmin başarısını azaltmadan mümkün olduğunca eğitim veri kümesini azaltarak eğitim sürecini kısaltmaya yarayacak yöntemler denenmiştir. Çalışmamızda, eğitilerek optimize edilen Dinamik Bayes Ağı (DBN) ve SVM kullanan iki aşamalı hibrit bir sınıflandırıcının (DSPRED), protein ikincil yapı tahmini için gelişmiş tahmin doğruluğu sağladığı gösterilmiştir. SVM eğitiminde kullanılacak olan veri kümesindeki örnek sayısını azaltmak için 7 kat çapraz doğrulama uygulanmış CB513 veri kümesi üzerinde iki farklı yöntem denenmiştir. Tabakalı örnekleme seçim stratejisinin kullanıldığı ilk yöntemde, eğitim veri kümesinden değişen oranlarda rastgele ve eşsiz veri örnekleri seçilmiştir. Sonuç olarak veri örneklerinin %50'si atılsa bile doğruluk oranını önemli ölçüde azaltmadan, model eğitim süresinde ortalama %73,38'lik bir iyileşme söz konusu olmuştur. İkinci yöntem, eğitim süresinin iyileştirilmesi amacıyla, veri örneklerini hiyerarşik bir kümeleme algoritması ile sınıflandırarak eğitim veri kümesindeki örnekleri küme merkezine en yakın komşularıyla değiştirmektedir. Öznitelik vektörlerini kümelemek için, validasyon setindeki tahmin doğruluğunu hesaplayarak, küme sayısı ve en yakın komşu sayısı gibi hiper parametrelerin optimize edildiği hiyerarşik kümeleme yöntemi uygulanmıştır. Sonuç olarak, ikinci yöntemde tahmin doğruluğunu azaltmadan eğitim veri kümesinin %26 oranında azaltılabileceği sonucu elde edilmiştir. Kullanılan hiyerarşik kümeleme teknikleri arasında ward yönteminin en iyi kümeleme sonucunu sağladığı gözlenmiştir.