A Study on Twitter User Gender Classification using Feature Selection

dc.contributor.authorParlar, Tuba
dc.date.accessioned2025-01-21T14:20:40Z
dc.date.available2025-01-21T14:20:40Z
dc.date.issued2022
dc.description.abstractIn today's business models, institutions or organizations want to know users’ opinions to improve their decision-making processes. Millions of people all around the world express their daily comments and thoughts using text messages, videos, or photos via social network applications. The rapid growth of social networking applications such as Facebook, Instagram, Twitter, and YouTube provides an attractive field for researchers to investigate the content of big data shared here and analyze user behavior. This enormous amount of data from social networks is used for effective marketing, personalized recommendation systems, finding opinion leaders, the pharmaceutical industry, or political policy making. A big amount of data obtained through social network applications is analyzed by machine learning methods. In this study, feature selection method is used to improve the automatic gender classification performance of Twitter users. The performance of the feature selection method that is applied on three datasets: user descriptions, tweets and where both are used together is evaluated with naive bayes and logistic regression classifiers. The results of the experiments show that the classification success of the selected features using chi-square feature selection method is much better with logistic regression classifier.
dc.description.abstractGünümüz iş modellerinde kurum veya kuruluşlar, karar alma süreçlerini iyileştirmek için kullanıcıların görüşlerini bilmek istemektedir. Dünyanın dört bir yanındaki milyonlarca insan, sosyal ağ uygulamaları aracılığıyla metin mesajları, videolar veya fotoğraflar kullanarak günlük yorumlarını ve düşüncelerini ifade etmektedir. Facebook, Instagram, Twitter ve YouTube gibi sosyal ağ uygulamalarının hızla büyümesi, burada paylaşılan büyük verilerin içeriğini araştırmak ve kullanıcı davranışlarını analiz etmek için araştırmacılara çekici bir alan sunmaktadır. Sosyal ağlardan gelen bu muazzam miktardaki veri, etkili pazarlama, kişiselleştirilmiş öneri sistemleri, fikir liderleri bulma, ilaç endüstrisi veya politik analizler için kullanılmaktadır. Sosyal ağ uygulamaları aracılığıyla elde edilen büyük miktarda veri, makine öğrenme yöntemleriyle analiz edilmektedir. Bu çalışmada Twitter kullanıcılarının otomatik cinsiyet sınıflandırması performansını artırmak için nitelik seçim yöntemi kullanılmıştır. Twitter kullanıcı tanımları, twit metinleri ve her ikisinin bir arada kullanıldığı üç veri kümesi üzerinde uygulanan nitelik seçim yönteminin performansı naive bayes ve lojistik regresyon sınıflayıcıları ile değerlendirilmiştir. Deney sonuçları ki-kare nitelik seçim yöntemi ile seçilen niteliklerin lojistik regresyon ile sınıflandırma başarısının çok daha üstün olduğunu göstermektedir.
dc.identifier.dergipark1214018
dc.identifier.doi10.29137/umagd.1214018
dc.identifier.issn1308-5514
dc.identifier.issue3-204
dc.identifier.startpage210
dc.identifier.urihttps://dergipark.org.tr/tr/download/article-file/2810452
dc.identifier.urihttps://dergipark.org.tr/tr/pub/umagd/issue/74185/1214018
dc.identifier.urihttps://doi.org/10.29137/umagd.1214018
dc.identifier.urihttps://hdl.handle.net/20.500.12587/19252
dc.identifier.volume1
dc.language.isotr
dc.publisherKırıkkale Üniversitesi
dc.relation.ispartofUluslararası Mühendislik Araştırma ve Geliştirme Dergisi
dc.relation.publicationcategoryMakale - Ulusal Hakemli Dergi
dc.rightsinfo:eu-repo/semantics/openAccess
dc.snmzKA_20241229
dc.subjectFeature selection
dc.subjectgender classification
dc.subjectmachine learning
dc.subjectsocial networks
dc.subjectTwitter
dc.subjectCinsiyet sınıflandırması
dc.subjectmakine öğrenme
dc.subjectnitelik seçimi
dc.subjectsosyal ağlar
dc.subjectTwitter
dc.subjectFeature selection
dc.subjectgender classification
dc.subjectmachine learning
dc.subjectsocial networks
dc.subjectTwitter
dc.subjectEngineering
dc.titleA Study on Twitter User Gender Classification using Feature Selection
dc.title.alternativeNitelik Seçimi Kullanarak Twitter Kullanıcısının Cinsiyet Sınıflandırması üzerine Bir Çalışma
dc.typeArticle

Dosyalar