Derin öğrenme tabanlı görüntü işleme ile nesne tanıma yöntemlerinde başarım oranı artırma
[ X ]
Tarih
2021
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
Kırıkkale Üniversitesi
Erişim Hakkı
info:eu-repo/semantics/openAccess
Özet
Bu çalışmada, imajların dijital ortama aktarılması, dijital imajlar üzerinde düşük, orta ve ileri seviye işlemlerin nasıl yapıldığı irdelenmiştir. Yıllar içerisinde görüntü işleme ve görüntülerde nesne tanımaya yönelik çalışmalar özetlenmiştir. Makine öğrenimi ve derin öğrenmenin görüntü işleme alanı ile olan etkileşimi açıklanmıştır. Bilgisayar görüsü yordamıyla hedef nesnelerin imaj içerisinde varlığı tespit edilirken başarıyı artırmaya yönelik teknikler teklif edilmiştir. Yüz tanıma alanında yaygın kullanılan veri setleri karşılaştırılmıştır ve çalışma için VGGFace2 ve LFW veri setleri seçilmiştir. Derin öğrenmede yaygın kullanılan hazır modeller irdelenerek, aralarından 4 tanesi (AlexNet, SqueezeNet, MobileNetV2, InceptionV3) seçilmiş ve çalışılmıştır. Histogram dengeleme, eğitim veri seti genişletme, yüze ait olmayan kısımların çıkartılması, imajların dikey konumlandırılması, öğrenme hiper parametrelerinin düzenlenmesi gibi tekniklerin transfer öğrenmedeki başarıya etkisi araştırılmış ve faydalı sonuçlara ulaşılmıştır. Sonuç olarak LFW veri setinde %100 başarılı öğrenme VGGFace2 100 kişilik alt veri setinde ise %95,47'lik doğruluk seviyesine sahip bir model eğitilmiştir.
In this study, how images transferred into digital, how low/medium/high level operations are done on images are examined. Studies on image processing and object recognition on images are summarized. The interaction between machine learning / deep learning and image processing was clarified. Some techniques to increase the accuracy while detecting the objects in images via computer vision. Datasets commonly used in face recognition were compared, VGGFace2 and LFW were selected for the study. By examining ready-made deep CNN models commonly used in deep learning, 4 of them (AlexNet, SqueezeNet, MobileNetV2, InceptionV3) were selected and studied. The effects of techniques such as histogram stabilization, training data set expansion, removal of non-face parts, vertical positioning of images, arrangement of learning hyperparameters on the success of transfer learning were investigated and useful results were obtained. As a result, a 100% successful learning model was trained in the LFW dataset, and a 95.47% accuracy level was trained in the VGGFace2 100-person sub-dataset.
In this study, how images transferred into digital, how low/medium/high level operations are done on images are examined. Studies on image processing and object recognition on images are summarized. The interaction between machine learning / deep learning and image processing was clarified. Some techniques to increase the accuracy while detecting the objects in images via computer vision. Datasets commonly used in face recognition were compared, VGGFace2 and LFW were selected for the study. By examining ready-made deep CNN models commonly used in deep learning, 4 of them (AlexNet, SqueezeNet, MobileNetV2, InceptionV3) were selected and studied. The effects of techniques such as histogram stabilization, training data set expansion, removal of non-face parts, vertical positioning of images, arrangement of learning hyperparameters on the success of transfer learning were investigated and useful results were obtained. As a result, a 100% successful learning model was trained in the LFW dataset, and a 95.47% accuracy level was trained in the VGGFace2 100-person sub-dataset.
Açıklama
Fen Bilimleri Enstitüsü, Bilgisayar Mühendisliği Ana Bilim Dalı
Anahtar Kelimeler
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control