IBRAHIM, MAULANA (2023) PERBANDINGAN KINERJA ALGORITMA KLASIFIKASI UNTUK DETEKSI BERITA HOAX DALAM BAHASA INDONESIA MENGGUNAKAN NAIVE BAYES, SUPPORT VECTOR MACHINE (SVM), DAN K-NEAREST NEIGHBOR (KNN). S1 thesis, Universitas Mercu Buana Jakarta.
Text (COVER)
01 COVER.pdf Download (400kB) |
|
Text (ABSTRAK)
02 ABSTRAK.pdf Download (244kB) |
|
Text (BAB I)
03 BAB 1.pdf Restricted to Registered users only Download (204kB) |
|
Text (BAB II)
04 BAB 2.pdf Restricted to Registered users only Download (279kB) |
|
Text (BAB III)
05 BAB 3.pdf Restricted to Registered users only Download (268kB) |
|
Text (BAB IV)
06 BAB 4.pdf Restricted to Registered users only Download (525kB) |
|
Text (BAB V)
07 BAB 5.pdf Restricted to Registered users only Download (197kB) |
|
Text (DAFTAR PUSTAKA)
08 DAFTAR PUSTAKA.pdf Restricted to Registered users only Download (175kB) |
|
Text (LAMPIRAN)
09 LAMPIRAN.pdf Restricted to Registered users only Download (3MB) |
Abstract
This study aims to compare the performance of three different classification algorithms, namely Naïve Bayes, SVM (Support Vector Machine), and KNN (KNearest Neighbor), in classifying hoax news using Indonesian. The spread of hoax news or false information has become a significant problem in today's digital era. With widespread dissemination via social media platforms and websites, hoax news easily spreads and influences public opinion. This study uses an Indonesian language news dataset consisting of hoax and non-hoax news. This data will be used to train and test the performance of the three classification algorithms. Classification results are displayed in precision, recall, and f1-score for each class, as well as overall accuracy. After conducting an evaluation, it was found that SVM achieves the best classification results with 100% accuracy. Because SVM with more complex TF-IDF representation seems to be the best choice. SVM's ability to handle complex data and the advantages of an accurate TF-IDF representation means the possibility of good performance for even more complex situations in the future. However, some improvements need to be made such as deeper analysis of the data, resampling techniques to overcome class imbalances, and parameter tuning to optimize model performance. Keywords: classification, hoax news, Indonesian language, Naïve Bayes, SVM, KNN Penelitian ini bertujuan untuk membandingkan kinerja ketiga algoritma pengklasifikasian yang berbeda, yaitu Naïve Bayes, SVM (Support Vector Machine), dan KNN (K-Nearest Neighbor), dalam mengklasifikasi berita hoax menggunakan bahasa Indonesia. Penyebaran berita hoax atau informasi palsu telah menjadi masalah yang signifikan dalam era digital saat ini. Dengan adanya penyebaran luas melalui platform media sosial dan situs web, berita hoax dengan mudah menyebar dan mempengaruhi opini publik. Penelitian ini menggunakan dataset berita berbahasa indonesia yang terdiri dari berita hoax dan bukan hoax. Data ini akan digunakan untuk melatih dan menguji kinerja ketiga algoritma pengklasifikasian tersebut. Hasil klasifikasi ditampilkan dalam precision, recall, dan f1-score untuk masing-masing kelas, serta akurasi keseluruhan. Setelah melakukan evaluasi, ditemukan bahwa SVM mencapai hasil klasifikasi terbaik dengan akurasi 100%. Karena SVM dengan representasi TF-IDF yang lebih kompleks tampak menjadi pilihan terbaik. Kemampuan SVM dalam menangani data kompleks dan keuntungan dari representasi TF-IDF yang akurat mendukung kemungkinan performa yang baik bahkan untuk situasi yang lebih kompleks di masa depan. Namun, perlu dilakukan beberapa peningkatan seperti analisis lebih mendalam terhadap data, teknik resampling untuk mengatasi ketidakseimbangan kelas, dan tuning parameter untuk mengoptimalkan performa model. Kata kunci: pengklasifikasian, berita hoax, bahasa Indonesia, Naïve Bayes, SVM, KNN
Actions (login required)
View Item |