TY - THES ID - umbprints96582 UR - http://repository.mercubuana.ac.id/96582/ A1 - ARHAB, BAGAS HAIDAR Y1 - 2025/07/19/ N2 - The purpose of this research is to examine the public sentiment on Twitter regarding the ?Indonesia Gelap? (?Dark Indonesia?) controversy, as well as to evaluate the performance of two text classification algorithms, Naive Bayes and Support Vector Machine (SVM). The data were collected from tweets discussing the issue and processed through several pre-processing steps, including special character removal, normalization, stopword removal, and tokenization. Sentiment labeling was performed automatically using an IndoBERT-based approach and manually verified to enhance label accuracy. After preprocessing, For feature weighting, TF-IDF (Term Frequency-Inverse Document Frequency) was used. With the dataset thus prepared, classification models based on Naive Bayes and SVM were built with the objective of categorizing tweets into three sentiment levels: negative, neutral, and positive. Based on the evaluation results, SVM performed better than Naive Bayes, achieving 97.9% accuracy and an F1-score of 72%, while Naive Bayes recorded 94.4% accuracy and 37% F1-score. These findings indicate that SVM is more effective in handling sentiment classification for Indonesianlanguage texts, particularly when the data distribution is imbalanced. Furthermore, this study confirms that Twitter is a valuable source for capturing real-time public opinion on emerging social and political issues. Key Word: sentiment analysis, Twitter, Indonesia Gelap, Naive Bayes, Support Vector Machine, TF-IDF Penelitian ini bertujuan untuk menganalisis sentimen netizen terhadap isu ?Indonesia Gelap? di media sosial Twitter serta membandingkan performa dua algoritma klasifikasi teks, yaitu Naive Bayes dan Support Vector Machine (SVM). Data diambil dari tweet yang membahas isu tersebut dan diproses melalui serangkaian tahap pre-processing, termasuk penghapusan karakter khusus, normalisasi, stopword removal, dan tokenisasi. Proses pelabelan sentimen dilakukan secara otomatis menggunakan pendekatan berbasis IndoBERT, yang kemudian diperkuat dengan verifikasi manual untuk meningkatkan akurasi label. Setelah data siap, pembobotan dilakukan dengan menggunakan metode Term Frequency ? Inverse Document Frequency (TF-IDF). Menggunakan kedua algoritma Naive Bayes dan SVM, model klasifikasi kemudian dilatih untuk mengukur performa mereka dalam mengklasifikasikan sentimen menjadi tiga kategori: negatif, netral, dan positif. Sementara SVM mengungguli Naive Bayes, kedua algoritma tersebut memiliki performa dan metrik evaluasi yang jauh berbeda satu sama lain. SVM tercatat mendapatkan akurasi 97,9% serta F1-score 72% sedangkan Naive Bayes hanya mendapatkan 94,4% akurasi dan 37% untuk F1- score. Temuan ini menegaskan bahwa algoritma SVM lebih efektif dalam menangani klasifikasi teks berbahasa Indonesia dengan distribusi kelas yang tidak seimbang. Penelitian ini juga membuktikan bahwa Twitter merupakan sumber informasi yang berharga dalam menangkap opini publik terhadap isu-isu sosial dan politik yang berkembang. Kata kunci: analisis sentimen, Twitter, Indonesia Gelap, Naive Bayes, Support Vector Machine, TF-IDF PB - Universitas Mercu Buana Jakarta KW - analisis sentimen KW - Twitter KW - Indonesia Gelap KW - Naive Bayes KW - Support Vector Machine KW - TF-IDF M1 - s1 TI - ANALISIS SENTIMEN NETIZEN TERHADAP ISU "INDONESIA GELAP" DI APLIKASI X MENGGUNAKAN METODE NAIVE BAYES DAN SUPPORT VECTOR MACHINE AV - restricted EP - 49 ER -