AZMI, SISKA SOFIA (2020) ANALISIS PERBANDINGAN ALGORITMA KLASIFIKASI UNTUK MEMPREDIKSI TWEET MENGANDUNG UNSUR BODY SHAMING. S1 thesis, Universitas Mercu Buana Jakarta.
Text (JURNAL MAHASISWA)
Yudisium 41516010041 Siska Sofia Azmi.pdf Restricted to Registered users only Download (1MB) |
Abstract
Body shaming is the act of embarrassing someone by giving bad comments about someone's physique. The act of embarrassing the body is not only done by word of mouth but is done through social media like Twitter. As a result of this crime, Body Shaming results in someone feeling insecure, feeling insecure, and acting to be perfect. Malicious comments made on Twitter Social Media are text mining. then the text is analyzed by separating into 2 classes, which are the words body shaming tweet or non body shaming tweet. The purpose of this study was to predict the extent to which these crimes were committed on Twitter social media. Retrieval of data from Twitter using the Twitter API and then the data is labeled between the Body Shaming and Non Body-Shaming classes, then the data enters the Pre-Processing Phase (data cleaning) including transforming cases, tokenize, stopwords, and stemming. After going through pre-processing data implemented into the classification algorithm and producing accuracy, Naïve Bayes classifier 86.30%, K-Nearest Neighbor 88.60% and C4.5 97.10%. The accuracy of the results can be concluded that classifying using the C4.5 algorithm is the best algorithm for predicting Tweets that contain elements of Body shaming. Key words: Body Shaming, Twitter, Sentiment Analysis, Classification, TFIDF Body shaming adalah tindakan mempermalukan seseorang dengan memberikan komentar buruk mengenai fisik seseorang. Tindakan mempermalukan tubuh tidak hanya dilakukan dari mulut ke mulut tetapi dilakukan melalui media sosial seperti Twitter. Akibat tindak kejahatan Body Shaming ini mengakibatkan seseorang merasa tidak percaya diri, merasa tidak aman (insecure), dan bertindak ingin menjadi sempurna. Komentar jahat yang dilontarkan di Media Sosial Twitter tersebut adalah teks mining. kemudian teks tersebut dianalisis dengan memisahkan kedalam 2 kelas, kata yang mana merupakan kata tweet body shaming atau tweet non body shaming. Tujuan penelitian ini dilakukan untuk mempredikisi sejauh mana kejahatan ini dilakukan di media sosial twitter. Pengambilan data dari Twitter menggunakan Twitter API kemudian data tersebut diberi label antara kelas Body Shaming dan Non Body Shaming selanjutnya data tersebut masuk ke Fase Pre-Processing (pembersihan data) diantaranya transforming case, tokenize, stopwords, dan stemming. Setelah melalui pre-processing data diimplementasikan ke dalam algoritma klasifikasi dan menghasilkan akurasi, Naïve Bayes classifier 86.30%, K-Nearest Neighbor 88.60% dan C4.5 97.10%. Keakuratan hasil dapat disimpulkan bahwa mengklasifikasikan menggunakan algoritma C4.5 adalah algoritma terbaik untuk memprediksi Tweet yang mengandung unsur-unsur Body shaming. Kata kunci: Body Shaming, Twitter, Analisis Sentimen, Klasifikasi, TFIDF
Actions (login required)
View Item |