Perbandingan Model Decision Tree, Naive Bayes dan Random Forest untuk Prediksi Klasifikasi Penyakit Jantung

Penulis

  • Deo Haganta Depari Universitas Pembangunan Nasional Veteran Jakarta
  • Yuni Widiastiwi Universitas Pembangunan Nasional Veteran Jakarta
  • Mayanda Mega Santoni Universitas Pembangunan Nasional Veteran Jakarta

DOI:

https://doi.org/10.52958/iftk.v18i3.4694

Kata Kunci:

Penyakit Jantung, Decision Tree, Naive Bayes, Perbandingan

Abstrak

Jantung sebuah rongga organ berotot yang memompa darah melalui pembuluh darah dengan kontraksi berirama yang terus berulang merupakan salah satu organ manusia yang berperan dalam sistem peredaran darah. Jantung sebagai salah organ terpenting dalam tubuh memiliki resiko kematian jika ada kelainan yang terjadi pada jantung. Beberapa masalah pada jantung dibagi menjadi dua yaitu penyakit jantung dan serangan jantung. WHO berdasarkan data menyatakan bahwa ada sebanyak 7,3 juta penduduk di dunia yang meninggal dikarenakan penyakit jantung. Penelitian ini menggunakan kumpulan data pasien penyakit jantung “Personal Key Indicators of Heart Disease” dan menerapkan algoritma klasifikasi Decision Tree, Naive Bayes dan Random Forest. Tujuan dari penelitian ini adalah untuk bagaimana mengolah dan melakukan analisa data, bagaimana penerapan metode Decision Tree, Naive Bayes dan Random Forest pada klasifikasi penyakit jantung, kemudian bagaimana hasil akurasi metode-metode yang digunakan tersebut, bagaimana hasil perbandingan antara Decision Tree, Naive Bayes dan Random Forests yang digunakan dan metode apa yang merupakan terbaik dari klasifikasi penyakit jantung.  Hasil dari penelitian ini adalah evaluasi performa metode klasifikasi Decision Tree, Naive Bayes dan Random Forest. Dimana nilai akurasi metode Decision Tree sebesar  0.71%, Naive Bayes sebesar 0.72% dan Random Forest sebesar 0.75%.

Referensi

T. Ariwibowo, “Perbandingan Metode Imputasi Mean, Median, Modus, Dan 1-Nn Pada Hasil Klasifikasi K-Nearest Neigbour (K-Nn),” Universitas Pembangunan Nasional “Veteran” Jakarta, 2019.

R. Donovan, “Heart Disease: Risk Factors, Prevention, and More.” https://www.healthline.com/health/heart-disease (diakses Jul 20, 2022).

NEJM Catalyst, “Healthcare Big Data and the Promise of Value-Based Care,” 2018, [Daring]. Tersedia pada: https://catalyst.nejm.org/doi/full/10.1056/CAT.18.0290.

G. Bonaccorso, “Machine Learning Algorithms: A reference guide to popular algorithms for data science and machine learning,” 2017.

S. Shalev-Shwartz dan S. Ben-David, “Understanding Machine Learning,” Cambridge University Press, 2014.

F. É. Pedregosa, G. Varoquaux, A. Gramfort, V. Michel, B. Thirion, O. Grisel, M. Blondel, P. Prettenhofer, R. Weiss, V. Dubourg, J. Vanderplas, A. Passos, D. Cournapeau, M. Brucher, M. Perrot, dan Duchesnay, “Scikit-learn: Machine Learning in Python,” J. Mach. Learn. Res. 12, 2011.

Google Developers, “Imbalanced Data.” https://developers.google.com/machine-learning/data-prep/construct/sampling-splitting/imbalanced-data (diakses Jul 20, 2022).

Kusrini dan E. T. Luthfi, “Algoritma Data Mining,” Yogyakarta: CV. ANDI OFFSET, 2009.

World Health Organization, “Cardiovascular diseases.”

M. Pal dan S. Parija, “Prediction of Heart Diseases using Random Forest,” J. Phys. Conf. Ser., vol. 1817, no. 1, hal. 012009, Maret 2021, doi: 10.1088/1742-6596/1817/1/012009.

Unduhan

Diterbitkan

2022-12-28

Terbitan

Bagian

Article