Derin öğrenme tabanlı görüntü işleme ile nesne tanıma yöntemlerinde başarım oranı artırma

[ X ]

Tarih

2021

Dergi Başlığı

Dergi ISSN

Cilt Başlığı

Yayıncı

Kırıkkale Üniversitesi

Erişim Hakkı

info:eu-repo/semantics/openAccess

Özet

Bu çalışmada, imajların dijital ortama aktarılması, dijital imajlar üzerinde düşük, orta ve ileri seviye işlemlerin nasıl yapıldığı irdelenmiştir. Yıllar içerisinde görüntü işleme ve görüntülerde nesne tanımaya yönelik çalışmalar özetlenmiştir. Makine öğrenimi ve derin öğrenmenin görüntü işleme alanı ile olan etkileşimi açıklanmıştır. Bilgisayar görüsü yordamıyla hedef nesnelerin imaj içerisinde varlığı tespit edilirken başarıyı artırmaya yönelik teknikler teklif edilmiştir. Yüz tanıma alanında yaygın kullanılan veri setleri karşılaştırılmıştır ve çalışma için VGGFace2 ve LFW veri setleri seçilmiştir. Derin öğrenmede yaygın kullanılan hazır modeller irdelenerek, aralarından 4 tanesi (AlexNet, SqueezeNet, MobileNetV2, InceptionV3) seçilmiş ve çalışılmıştır. Histogram dengeleme, eğitim veri seti genişletme, yüze ait olmayan kısımların çıkartılması, imajların dikey konumlandırılması, öğrenme hiper parametrelerinin düzenlenmesi gibi tekniklerin transfer öğrenmedeki başarıya etkisi araştırılmış ve faydalı sonuçlara ulaşılmıştır. Sonuç olarak LFW veri setinde %100 başarılı öğrenme VGGFace2 100 kişilik alt veri setinde ise %95,47'lik doğruluk seviyesine sahip bir model eğitilmiştir.
In this study, how images transferred into digital, how low/medium/high level operations are done on images are examined. Studies on image processing and object recognition on images are summarized. The interaction between machine learning / deep learning and image processing was clarified. Some techniques to increase the accuracy while detecting the objects in images via computer vision. Datasets commonly used in face recognition were compared, VGGFace2 and LFW were selected for the study. By examining ready-made deep CNN models commonly used in deep learning, 4 of them (AlexNet, SqueezeNet, MobileNetV2, InceptionV3) were selected and studied. The effects of techniques such as histogram stabilization, training data set expansion, removal of non-face parts, vertical positioning of images, arrangement of learning hyperparameters on the success of transfer learning were investigated and useful results were obtained. As a result, a 100% successful learning model was trained in the LFW dataset, and a 95.47% accuracy level was trained in the VGGFace2 100-person sub-dataset.

Açıklama

Fen Bilimleri Enstitüsü, Bilgisayar Mühendisliği Ana Bilim Dalı

Anahtar Kelimeler

Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control

Kaynak

WoS Q Değeri

Scopus Q Değeri

Cilt

Sayı

Künye