HERMANSYAH, IBNU (2025) KOMPRASI DATA IMBLANCE DATA MENGGUNAKAN SMOTE-RBO, RN-SMOTE, SMOTE-ENN, SMOTE, DBSCAN-SMOTE DENGAN ATRIBUT STROKE. S1 thesis, Universitas Mercu Buana Jakarta.
|
Text (HAL COVER)
01 COVER.pdf Download (329kB) | Preview |
|
![]() |
Text (BAB I)
02 BAB 1.pdf Restricted to Registered users only Download (39kB) |
|
![]() |
Text (BAB II)
03 BAB 2.pdf Restricted to Registered users only Download (187kB) |
|
![]() |
Text (BAB III)
04 BAB 3.pdf Restricted to Registered users only Download (116kB) |
|
![]() |
Text (BAB IV)
05 BAB 4.pdf Restricted to Registered users only Download (483kB) |
|
![]() |
Text (BAB V)
06 BAB 5.pdf Restricted to Registered users only Download (29kB) |
|
![]() |
Text (DAFTAR PUSTAKA)
07 DAFTAR PUSTAKA.pdf Restricted to Registered users only Download (156kB) |
|
![]() |
Text (LAMPIRAN)
08 LAMPIRAN.pdf Restricted to Registered users only Download (660kB) |
Abstract
Stroke, also known as Cerebrovascular Accident (CVA), is a serious disease that is a leading cause of death and disability worldwide. The prevalence of stroke continues to increase, especially in developing countries, including Indonesia. Advances in medical technology enable the use of machine learning to support early detection and stroke prediction, which can facilitate faster intervention. However, class imbalance in the dataset can affect prediction accuracy and lead to bias towards the majority class. This study compares the performance of other algorithms in stroke classification by applying the Synthetic Minority Oversampling Technique (SMOTE) to address data imbalance. Based on the 2018 Riskesdas (Basic Health Research) of the Indonesian Ministry of Health, Indonesia has 713,783 stroke sufferers. West Nusa Tenggara (NTB) province experienced an increase in stroke cases from 2013 to 2018, with a prevalence of 4.5% to 8%. This machine learning approach can predict a disease. With this Machine Learning approach, class imbalance was found in the dataset used. This creates imbalanced classes because the majority class is much higher than the minority class. The results show that the combination of SMOTE and the algorithm improves prediction accuracy and model performance compared to conventional methods. Implementing this technique could be an effective solution for improving early stroke detection and contributing to better disease prevention in the medical world. Keywords: Stroke, CVA, disability, Indonesia, Stroke Prediction, Machine Learning, Medical technology, Imbalanced data, privacy, Disease prevention, Oversampling, SMOTE, Classification, Data Mining, Health Prediction, Indonesia. Pada penyakit Stroke atau dikenal dengan Cerebrovascular Accident (CVA), merupakan penyakit serius yang menjadi penyebab utama kematian dan kecacatan di dunia. Prevalensi stroke terus meningkat, terutama di negara berkembang, termasuk Indonesia. Perkembangan teknologi medis memungkinkan penggunaan machine learning untuk mendukung deteksi dini dan prediksi stroke, yang dapat membantu intervensi lebih cepat. Namun, ketidakseimbangan kelas dalam dataset dapat memengaruhi akurasi prediksi dan mengarah pada bias terhadap kelas mayoritas. Penelitian ini membandingkan kinerja algoritma yang lainnya dalam klasifikasi penyakit stroke dengan menerapkan Synthetic Minority Oversampling Technique (SMOTE) untuk menangani ketidakseimbangan data. Dari hasil Riskesdas Kemenkes RI 2018, di Indonesia memilki jumlah penderita stroke 713.783. Di provinsi NTB mengalami sebuah peningkatan penyakit stroke dari tahun 2013 samapi pada tahun 2018 pada pervalensi yang memiliki jumlah 4,5% menjadi 8%. Machine learning pendekatan ini dapat memprediksi suatu penyakit. Dengan adannya pendektan pada Machine Learning ini, diteukannya imblance class pada dataset yang di gunakan. Hal ini membuat imblance classs terjadi karena cllas majority jauh lebih tinggi dibandingkan class minority Hasil penelitian menunjukkan bahwa kombinasi SMOTE dan algoritma meningkatkan akurasi prediksi serta performa model dibandingkan metode konvensional. Implementasi teknik ini dapat menjadi solusi efektif dalam meningkatkan deteksi dini stroke dan memberikan kontribusi bagi dunia medis untuk pencegahan penyakit yang lebih baik. Kata kunci: Stroke, CVA, kecacatan, indonesia, Prediksi Stroke, Machine Learning, Teknologi medis, Data tidak Simbang, privalensi, Pencegahan penyakit, Oversampling, SMOTE, Klasifikasi, Data Mining, Prediksi Kesehatan, Indonesia.
Actions (login required)
![]() |
View Item |