Koroner arter hastalığı riskinin makine öğrenmesi ile analiz edilmesi
Yükleniyor...
Dosyalar
Tarih
2018
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
Kırıkkale Üniversitesi
Erişim Hakkı
info:eu-repo/semantics/openAccess
Özet
Kardiyovasküler hastalıklar, tüm dünyada ölüm nedenleri arasında ilk sırada yer almaktadır. Kardiyovasküler hastalıklar içerisinde ölümcül sonuçları olan en yaygın klinik tip koroner arter hastalığıdır. Bu nedenle, koroner arter hastalığının erken dönemde ve doğru bir biçimde saptanmasında tanı işlemlerinin iyileştirilmesi hayati önem taşımaktadır. Koroner anjiyografi yöntemi, koroner arter hastalığının tanısında ve hastalık sürecinin değerlendirilmesinde en yaygın kullanılan girişimsel yöntem olarak kabul edilmektedir. Ancak, koroner anjiyografi yöntemi yüksek maliyeti, ileri seviyede eğitimli personel gerektirmesi ve önemli klinik komplikasyonları olan girişimsel bir işlem olması sebebiyle, tarama amaçlı ya da tedavi altındaki hastaların takibi açısından kullanımı uygun değildir. Bu nedenle, birçok araştırmacı koroner arter hastalığının tanısında, makine öğrenmesi gibi alternatif yöntemler üzerinde çalışmalar yürütmektedir. Makine öğrenmesi yöntemlerinin klinik alanlarda kullanımı ile birlikte, hastalar için mevcut tüm değişkenlerin kolayca yorumlanarak değerlendirilmesi sağlanabilmekte ve bu şekilde her adımın tanısal doğruluğu artırılabilmektedir. Bu çalışmada, Kaliforniya Üniversitesi, Irvine (UCI) veri kümesi koleksiyonundan alınan Cleveland, Macaristan, İsviçre ve VA Long Beach kalp hastalığı veri kümeleri üzerinde Rastgele Orman Algoritması kullanılarak koroner arter hastalığı riski analiz edilmiştir. Veri analizi aşamasında, belirtilen tüm veri kümeleri incelenmiştir. Ancak, sınıflama modeli daha az eksik veri içermeleri ve dengeli bir dağılıma sahip olmaları nedeniyle Cleveland ve Macaristan veri kümeleri üzerinde kurulmuştur. Veri analizi, kardiyoloji alanında uzman bir hekimin rehberliğinde grafiksel ve istatistiksel yöntemlerle yapılmıştır. Uygulanan sınıflama modeli sonucunda, Cleveland veri kümesi üzerinde %86,13 doğruluk oranı ve Macaristan ve Cleveland veri kümelerinin birleştirilmesi ile elde edilen 596 hasta kaydından oluşan veri kümesi üzerinde ise %80 doğruluk oranı elde edilmiştir. Ayrıca, modelin uygulandığı her iki veri kümesinde de göğüs ağrısı tipi ve egzersizle tetiklenen ST depresyonu sınıflama açısından en önemli iki değişen olarak saptanmıştır. Bu çalışmanın, koroner arter hastalığı olan bireylerin hastalık yönetiminde ve girişimsel klinik işlem uygulanacak hasta grubunun doğru bir biçimde belirlenmesinde sağlık çalışanlarına rehberlik edeceği düşünülmektedir. Bununla birlikte makine öğrenmesi yaklaşımı kullanılarak yapılan sınıflama sonucunda risk grubunun belirlenerek yalnızca gerekli hastalara girişimsel işlemlerin uygulanması sağlanabilecektir. Ayrıca, işlemden kaynaklanan medikal hatalar, sağlık bakım maliyeti ve sağlık uzmanı gereksinimi azaltılırken, hasta güvenliği ve klinik karar kalitesi artırılacaktır.
Cardiovascular diseases are the leading cause of death worldwide. Coronary artery disease is the most common clinical type of cardiovascular diseases with fatal outcomes. For this reason, improvement of diagnostic procedures for early identification of coronary heart disease has vital importance. Angiography procedure is accepted as the most common interventional method used in the diagnosis and evaluation process of coronary artery disease. However, angiography procedure is not suitable for screening patients because it is an interventional procedure with significant clinical complications, requiring high-cost, advanced educated medical personnel. For this reason, many researchers are working on alternative methods and models such as machine learning in the diagnosis process of coronary artery disease. With the clinical use of machine learning methods, it is possible to provide an effortless evaluation of all available variables for patients and thus improve the diagnostic accuracy of each step. In this study, the risk of coronary artery disease was analyzed using a random forest algorithm on Cleveland, Hungary, Switzerland, and VA Long Beach heart disease data sets from the University of California, Irvine (UCI). All data sets were examined in data analysis process. However, the classification model is based on data sets in Cleveland and Hungary because they have less a missing value and balanced distribution. Data analysis was performed with graphical and statistical methods under the guidance of cardiologist. As a result of the classification model, 86.13% accuracy rate was obtained on the Cleveland dataset, and 80% accuracy was obtained on the dataset of 596 patient records formed by combining the Hungarian dataset and Cleveland dataset. In addition, the two most important attributes in terms of classification were chest pain type and ST depression triggered by exercise in both data sets. This study suggests that health professionals in terms of diagnosis and treatment process of individuals with coronary heart disease and determining the right patient group to perform an interventional clinical procedure. In addition, patient safety and clinical decision quality will be improved when the risk group is identified by classification process using the machine learning approach and only the necessary interventional medical procedures are applied, while the medical errors, health care costs and healthcare specialist need arising from the procedure are reduced.
Cardiovascular diseases are the leading cause of death worldwide. Coronary artery disease is the most common clinical type of cardiovascular diseases with fatal outcomes. For this reason, improvement of diagnostic procedures for early identification of coronary heart disease has vital importance. Angiography procedure is accepted as the most common interventional method used in the diagnosis and evaluation process of coronary artery disease. However, angiography procedure is not suitable for screening patients because it is an interventional procedure with significant clinical complications, requiring high-cost, advanced educated medical personnel. For this reason, many researchers are working on alternative methods and models such as machine learning in the diagnosis process of coronary artery disease. With the clinical use of machine learning methods, it is possible to provide an effortless evaluation of all available variables for patients and thus improve the diagnostic accuracy of each step. In this study, the risk of coronary artery disease was analyzed using a random forest algorithm on Cleveland, Hungary, Switzerland, and VA Long Beach heart disease data sets from the University of California, Irvine (UCI). All data sets were examined in data analysis process. However, the classification model is based on data sets in Cleveland and Hungary because they have less a missing value and balanced distribution. Data analysis was performed with graphical and statistical methods under the guidance of cardiologist. As a result of the classification model, 86.13% accuracy rate was obtained on the Cleveland dataset, and 80% accuracy was obtained on the dataset of 596 patient records formed by combining the Hungarian dataset and Cleveland dataset. In addition, the two most important attributes in terms of classification were chest pain type and ST depression triggered by exercise in both data sets. This study suggests that health professionals in terms of diagnosis and treatment process of individuals with coronary heart disease and determining the right patient group to perform an interventional clinical procedure. In addition, patient safety and clinical decision quality will be improved when the risk group is identified by classification process using the machine learning approach and only the necessary interventional medical procedures are applied, while the medical errors, health care costs and healthcare specialist need arising from the procedure are reduced.
Açıklama
Anahtar Kelimeler
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control, , , , , , , ,