-->

PERBANDINGAN KINERJA ALGORITMA KLASIFIKASI UNTUK DETEKSI BERITA HOAX DALAM BAHASA INDONESIA MENGGUNAKAN NAIVE BAYES, SUPPORT VECTOR MACHINE (SVM), DAN K-NEAREST NEIGHBOR (KNN)

IBRAHIM, MAULANA (2023) PERBANDINGAN KINERJA ALGORITMA KLASIFIKASI UNTUK DETEKSI BERITA HOAX DALAM BAHASA INDONESIA MENGGUNAKAN NAIVE BAYES, SUPPORT VECTOR MACHINE (SVM), DAN K-NEAREST NEIGHBOR (KNN). S1 thesis, Universitas Mercu Buana Jakarta.

[img] Text (COVER)
01 COVER.pdf

Download (400kB)
[img] Text (ABSTRAK)
02 ABSTRAK.pdf

Download (244kB)
[img] Text (BAB I)
03 BAB 1.pdf
Restricted to Registered users only

Download (204kB)
[img] Text (BAB II)
04 BAB 2.pdf
Restricted to Registered users only

Download (279kB)
[img] Text (BAB III)
05 BAB 3.pdf
Restricted to Registered users only

Download (268kB)
[img] Text (BAB IV)
06 BAB 4.pdf
Restricted to Registered users only

Download (525kB)
[img] Text (BAB V)
07 BAB 5.pdf
Restricted to Registered users only

Download (197kB)
[img] Text (DAFTAR PUSTAKA)
08 DAFTAR PUSTAKA.pdf
Restricted to Registered users only

Download (175kB)
[img] Text (LAMPIRAN)
09 LAMPIRAN.pdf
Restricted to Registered users only

Download (3MB)

Abstract

This study aims to compare the performance of three different classification algorithms, namely Naïve Bayes, SVM (Support Vector Machine), and KNN (KNearest Neighbor), in classifying hoax news using Indonesian. The spread of hoax news or false information has become a significant problem in today's digital era. With widespread dissemination via social media platforms and websites, hoax news easily spreads and influences public opinion. This study uses an Indonesian language news dataset consisting of hoax and non-hoax news. This data will be used to train and test the performance of the three classification algorithms. Classification results are displayed in precision, recall, and f1-score for each class, as well as overall accuracy. After conducting an evaluation, it was found that SVM achieves the best classification results with 100% accuracy. Because SVM with more complex TF-IDF representation seems to be the best choice. SVM's ability to handle complex data and the advantages of an accurate TF-IDF representation means the possibility of good performance for even more complex situations in the future. However, some improvements need to be made such as deeper analysis of the data, resampling techniques to overcome class imbalances, and parameter tuning to optimize model performance. Keywords: classification, hoax news, Indonesian language, Naïve Bayes, SVM, KNN Penelitian ini bertujuan untuk membandingkan kinerja ketiga algoritma pengklasifikasian yang berbeda, yaitu Naïve Bayes, SVM (Support Vector Machine), dan KNN (K-Nearest Neighbor), dalam mengklasifikasi berita hoax menggunakan bahasa Indonesia. Penyebaran berita hoax atau informasi palsu telah menjadi masalah yang signifikan dalam era digital saat ini. Dengan adanya penyebaran luas melalui platform media sosial dan situs web, berita hoax dengan mudah menyebar dan mempengaruhi opini publik. Penelitian ini menggunakan dataset berita berbahasa indonesia yang terdiri dari berita hoax dan bukan hoax. Data ini akan digunakan untuk melatih dan menguji kinerja ketiga algoritma pengklasifikasian tersebut. Hasil klasifikasi ditampilkan dalam precision, recall, dan f1-score untuk masing-masing kelas, serta akurasi keseluruhan. Setelah melakukan evaluasi, ditemukan bahwa SVM mencapai hasil klasifikasi terbaik dengan akurasi 100%. Karena SVM dengan representasi TF-IDF yang lebih kompleks tampak menjadi pilihan terbaik. Kemampuan SVM dalam menangani data kompleks dan keuntungan dari representasi TF-IDF yang akurat mendukung kemungkinan performa yang baik bahkan untuk situasi yang lebih kompleks di masa depan. Namun, perlu dilakukan beberapa peningkatan seperti analisis lebih mendalam terhadap data, teknik resampling untuk mengatasi ketidakseimbangan kelas, dan tuning parameter untuk mengoptimalkan performa model. Kata kunci: pengklasifikasian, berita hoax, bahasa Indonesia, Naïve Bayes, SVM, KNN

Item Type: Thesis (S1)
Call Number CD: FIK/INFO. 23 160
NIM/NIDN Creators: 41519010030
Uncontrolled Keywords: pengklasifikasian, berita hoax, bahasa Indonesia, Naïve Bayes, SVM, KNN
Subjects: 000 Computer Science, Information and General Works/Ilmu Komputer, Informasi, dan Karya Umum > 000. Computer Science, Information and General Works/Ilmu Komputer, Informasi, dan Karya Umum > 003 Systems/Sistem-sistem
000 Computer Science, Information and General Works/Ilmu Komputer, Informasi, dan Karya Umum > 000. Computer Science, Information and General Works/Ilmu Komputer, Informasi, dan Karya Umum > 003 Systems/Sistem-sistem > 003.5 Computer Modeling and Simulation/Model dan Simulasi Komputer
000 Computer Science, Information and General Works/Ilmu Komputer, Informasi, dan Karya Umum > 000. Computer Science, Information and General Works/Ilmu Komputer, Informasi, dan Karya Umum > 004 Data Processing, Computer Science/Pemrosesan Data, Ilmu Komputer, Teknik Informatika
000 Computer Science, Information and General Works/Ilmu Komputer, Informasi, dan Karya Umum > 000. Computer Science, Information and General Works/Ilmu Komputer, Informasi, dan Karya Umum > 004 Data Processing, Computer Science/Pemrosesan Data, Ilmu Komputer, Teknik Informatika > 004.1 General Works on Specific Types of Computers/Karya Umum tentang Tipe-tipe Khusus Komputer
Divisions: Fakultas Ilmu Komputer > Informatika
Depositing User: CALVIN PRASETYO
Date Deposited: 13 Oct 2023 03:37
Last Modified: 13 Oct 2023 03:37
URI: http://repository.mercubuana.ac.id/id/eprint/82468

Actions (login required)

View Item View Item