Yapay zeka yaklaşımı ile son yıllarda ve geleceğe yönelik mesleki değişimler ve eğilimlerin analizi
Abstract
Metin madenciliği, metinsel verileri veri kaynakları olarak kullanan veri madenciliği yöntemidir. Metin madenciliği yönteminde, kaynak olarak alınan metin dilbilimsel olarak, özet, önemli, anahtar veri çıkarımı amaçlı olarak kullanılır. Metin veri madenciliği ile analiz edilen belgeler, öğrenme algoritmaları ile işlenerek analiz konuları ile ilgili tahminler üretilmeye çalışılır. Öğrenme modelleri denetimli ve denetimsiz öğrenme olmak üzere 2 farklı algoritma modeli bulunmaktadır. Bu çalışmada denetimsiz öğrenme algoritmalardan, kümeleşme yöntemlerinden yararlanılarak verilerin içerdiği ilişkiler ve özellikler ile ilgili çıkarımlar yapılmaya çalışılmıştır. Metin veri kaynağı olarak IPA raporları, metin madenciliği teknikleri ile analiz edilmeye çalışılmıştır. Çalışmadaki amacımız, mesleklerle ilgili metinlerden çıkarım yapmak ve bu çıkarımlarla tahminler yapmaya çalışmaktır. Mesleklere yönelik arama kriterlerine göre, internet kaynaklarından edinilen belgeler öğrenme ve tahmin belgeleri olarak 2 başlıkta ele alınmıştır. Belgeler üzerinde metin madenciliği süreçlerini işleterek, öğrenme kümesindeki belgelere, öğrenme algoritmaları uyguladıktan sonra, tahmin belgeleri ile mesleklere yönelik tahminler yaparak, sonuçları sunulmuştur. Çalışmadaki asıl amacımız geleceğin mesleklerine yönelik analizler yapmak ve tahminler üretmektir. Bu doğrultuda, geleceğin meslekleri arama kriteri ile erişilen belgelerde toplu frekans analizi süreci çalıştırılmıştır. Frekans analizi sonuçları, çeşitli kaynaklardan faydalanılarak oluşturulan geleceğin meslekleri listesi ile filtrelenmiştir. Geleceğin mesleklerine yönelik veri kümesi, makine öğrenme algoritmalarına tabi tutularak, tahminler üretilmiştir. Çalışmada elde edilen sonuçlar, çeşitli istatistiki değerlendirme yöntemleriyle değerlendirilerek, grafiksel gösterimleri yapılmıştır. Anahtar Kelimeler: Metin madencliği, makine öğrenmesi, meslekler, denetimli öğrenme Text mining is a method of data mining in which the data to be analyzed is in text form. In the text data mining method, the text is used linguistically for extracting summary, important, key data. Documents analyzed with text data mining are processed with learning algorithms to produce predictions about analysis topics. There are two different classes of algorithm models in learning models. In supervised learning, there are data related to the model that we will try to teach the system, and by teaching this data to the system, the relationship between data input and output values is tried to be found. In unsupervised learning, there is only data. Just as there is no information on the subject to which the data is related, there is also no feedback on the forecast values. In these algorithms, it is tried to make inferences about the relationships and properties of the data by using clustering methods. In this study, first of all, IPA reports have been tried to be analyzed with text mining techniques. The data obtained in these analysis processes were visualized with frequency analysis and density graphs. Our main purpose in the study is to make inferences from texts about professions and to make predictions with these inferences. At this point, we divided the documents we downloaded according to the search criteria for professions into two classes as learning and estimation documents. By operating text mining processes on the documents, after applying learning algorithms to these documents in the learning set, we presented the results by making predictions about the professions with estimation documents. We evaluated the obtained results with various statistical evaluation methods and graphically displayed them. Documents accessed on the internet for future professions were subjected to text analysis and learning processes. The obtained results were evaluated by evaluation methods. Keywords: text mining, machine learning, professions, supervised learning