KOMPRASI DATA IMBLANCE DATA MENGGUNAKAN SMOTE-RBO, RN-SMOTE, SMOTE-ENN, SMOTE, DBSCAN-SMOTE DENGAN ATRIBUT STROKE

HERMANSYAH, IBNU (2025) KOMPRASI DATA IMBLANCE DATA MENGGUNAKAN SMOTE-RBO, RN-SMOTE, SMOTE-ENN, SMOTE, DBSCAN-SMOTE DENGAN ATRIBUT STROKE. S1 thesis, Universitas Mercu Buana Jakarta.

[img]
Preview
Text (HAL COVER)
01 COVER.pdf

Download (329kB) | Preview
[img] Text (BAB I)
02 BAB 1.pdf
Restricted to Registered users only

Download (39kB)
[img] Text (BAB II)
03 BAB 2.pdf
Restricted to Registered users only

Download (187kB)
[img] Text (BAB III)
04 BAB 3.pdf
Restricted to Registered users only

Download (116kB)
[img] Text (BAB IV)
05 BAB 4.pdf
Restricted to Registered users only

Download (483kB)
[img] Text (BAB V)
06 BAB 5.pdf
Restricted to Registered users only

Download (29kB)
[img] Text (DAFTAR PUSTAKA)
07 DAFTAR PUSTAKA.pdf
Restricted to Registered users only

Download (156kB)
[img] Text (LAMPIRAN)
08 LAMPIRAN.pdf
Restricted to Registered users only

Download (660kB)

Abstract

Stroke, also known as Cerebrovascular Accident (CVA), is a serious disease that is a leading cause of death and disability worldwide. The prevalence of stroke continues to increase, especially in developing countries, including Indonesia. Advances in medical technology enable the use of machine learning to support early detection and stroke prediction, which can facilitate faster intervention. However, class imbalance in the dataset can affect prediction accuracy and lead to bias towards the majority class. This study compares the performance of other algorithms in stroke classification by applying the Synthetic Minority Oversampling Technique (SMOTE) to address data imbalance. Based on the 2018 Riskesdas (Basic Health Research) of the Indonesian Ministry of Health, Indonesia has 713,783 stroke sufferers. West Nusa Tenggara (NTB) province experienced an increase in stroke cases from 2013 to 2018, with a prevalence of 4.5% to 8%. This machine learning approach can predict a disease. With this Machine Learning approach, class imbalance was found in the dataset used. This creates imbalanced classes because the majority class is much higher than the minority class. The results show that the combination of SMOTE and the algorithm improves prediction accuracy and model performance compared to conventional methods. Implementing this technique could be an effective solution for improving early stroke detection and contributing to better disease prevention in the medical world. Keywords: Stroke, CVA, disability, Indonesia, Stroke Prediction, Machine Learning, Medical technology, Imbalanced data, privacy, Disease prevention, Oversampling, SMOTE, Classification, Data Mining, Health Prediction, Indonesia. Pada penyakit Stroke atau dikenal dengan Cerebrovascular Accident (CVA), merupakan penyakit serius yang menjadi penyebab utama kematian dan kecacatan di dunia. Prevalensi stroke terus meningkat, terutama di negara berkembang, termasuk Indonesia. Perkembangan teknologi medis memungkinkan penggunaan machine learning untuk mendukung deteksi dini dan prediksi stroke, yang dapat membantu intervensi lebih cepat. Namun, ketidakseimbangan kelas dalam dataset dapat memengaruhi akurasi prediksi dan mengarah pada bias terhadap kelas mayoritas. Penelitian ini membandingkan kinerja algoritma yang lainnya dalam klasifikasi penyakit stroke dengan menerapkan Synthetic Minority Oversampling Technique (SMOTE) untuk menangani ketidakseimbangan data. Dari hasil Riskesdas Kemenkes RI 2018, di Indonesia memilki jumlah penderita stroke 713.783. Di provinsi NTB mengalami sebuah peningkatan penyakit stroke dari tahun 2013 samapi pada tahun 2018 pada pervalensi yang memiliki jumlah 4,5% menjadi 8%. Machine learning pendekatan ini dapat memprediksi suatu penyakit. Dengan adannya pendektan pada Machine Learning ini, diteukannya imblance class pada dataset yang di gunakan. Hal ini membuat imblance classs terjadi karena cllas majority jauh lebih tinggi dibandingkan class minority Hasil penelitian menunjukkan bahwa kombinasi SMOTE dan algoritma meningkatkan akurasi prediksi serta performa model dibandingkan metode konvensional. Implementasi teknik ini dapat menjadi solusi efektif dalam meningkatkan deteksi dini stroke dan memberikan kontribusi bagi dunia medis untuk pencegahan penyakit yang lebih baik. Kata kunci: Stroke, CVA, kecacatan, indonesia, Prediksi Stroke, Machine Learning, Teknologi medis, Data tidak Simbang, privalensi, Pencegahan penyakit, Oversampling, SMOTE, Klasifikasi, Data Mining, Prediksi Kesehatan, Indonesia.

Item Type: Thesis (S1)
Call Number CD: FIK/INFO. 25 175
NIM/NIDN Creators: 41521010014
Uncontrolled Keywords: Stroke, CVA, kecacatan, indonesia, Prediksi Stroke, Machine Learning, Teknologi medis, Data tidak Simbang, privalensi, Pencegahan penyakit, Oversampling, SMOTE, Klasifikasi, Data Mining, Prediksi Kesehatan, Indonesia.
Subjects: 000 Computer Science, Information and General Works/Ilmu Komputer, Informasi, dan Karya Umum > 000. Computer Science, Information and General Works/Ilmu Komputer, Informasi, dan Karya Umum > 004 Data Processing, Computer Science/Pemrosesan Data, Ilmu Komputer, Teknik Informatika
000 Computer Science, Information and General Works/Ilmu Komputer, Informasi, dan Karya Umum > 000. Computer Science, Information and General Works/Ilmu Komputer, Informasi, dan Karya Umum > 006 Special Computer Methods/Metode Komputer Tertentu > 006.3 Artificial Intelligence/Kecerdasan Buatan > 006.31 Machine Learning/Pembelajaran Mesin
600 Technology/Teknologi > 610 Medical, Medicine, and Health Sciences/Ilmu Kedokteran, Ilmu Pengobatan dan Ilmu Kesehatan > 616 Diseases/Penyakit > 616.1 Diseases of Cardiovascular System/Penyakit pada Sistem Kardiovaskular
Divisions: Fakultas Ilmu Komputer > Informatika
Depositing User: khalimah
Date Deposited: 18 Sep 2025 02:11
Last Modified: 18 Sep 2025 02:11
URI: http://repository.mercubuana.ac.id/id/eprint/98038

Actions (login required)

View Item View Item