PERBANDINGAN ALGORITMA NA�VE BAYES DAN LOGISTIC REGRESSION UNTUK ANALISA REVIEW FILM PADA INTERNET MOVIE DATABASE

YUSRIL, MUHAMMAD IQBAL (2023) PERBANDINGAN ALGORITMA NA�VE BAYES DAN LOGISTIC REGRESSION UNTUK ANALISA REVIEW FILM PADA INTERNET MOVIE DATABASE. S1 thesis, Universitas Mercu Buana Jakarta.

[img]
Preview
Text (COVER)
01 COVER.pdf

Download (282kB) | Preview
[img]
Preview
Text (ABSTRAK)
02 ABSTRAK.pdf

Download (111kB) | Preview
[img] Text (BAB I)
03 BAB 1.pdf
Restricted to Repository staff only

Download (178kB)
[img] Text (BAB II)
04 BAB 2.pdf
Restricted to Registered users only

Download (361kB)
[img] Text (BAB III)
05 BAB 3.pdf
Restricted to Registered users only

Download (366kB)
[img] Text (BAB IV)
06 BAB 4.pdf
Restricted to Registered users only

Download (785kB)
[img] Text (BAB V)
07 BAB 5.pdf
Restricted to Registered users only

Download (148kB)
[img] Text (DAFTAR PUSTAKA)
08 DAFTAR PUSTAKA.pdf
Restricted to Registered users only

Download (338kB)
[img] Text (LAMPIRAN)
09 LAMPIRAN.pdf
Restricted to Registered users only

Download (2MB)

Abstract

h heightened the audience's interest. People's opinions about the films they watch can be positive or negative. These opinions are often found in the form of reviews and can be analyzed using sentiment analysis techniques. By using sentiment analysis on a collection of film reviews, the public can obtain recommendations for films worth watching. One popular platform for reading film reviews is Internet Movie Database (IMDb), which provides comprehensive information about various films along with user reviews. In this study, sentiment analysis of user reviews on films was conducted using the Naive Bayes and Logistic Regression algorithms. The dataset used in this study was obtained through the process of scraping review data from the IMDb website. Subsequently, the dataset underwent preprocessing steps such as cleaning and format conversion, and sentiment labeling was performed, classifying them as positive or negative based on the reviews and rating scores. The performance of the algorithms was evaluated using Confusion Matrix. The results showed that the Naive Bayes algorithm achieved an accuracy of 82%, while Logistic Regression achieved an accuracy of 83%. This indicates that the Logistic Regression algorithm performed slightly better, as it is suitable for handling imbalanced data. Keywords : Sentiment Analysis, Movie Reviews, Classification, IMDb, Naïve Bayes, Logistic Regression Film merupakan salah satu bentuk hiburan yang populer di seluruh dunia, termasuk di Indonesia, yang diminati oleh berbagai kalangan, baik anak-anak maupun orang dewasa. Pada tahun 2020, terjadi peningkatan signifikan dalam jumlah penonton film, terutama karena adanya pandemi COVID-19 yang membuat minat penonton semakin tinggi. Opini masyarakat terhadap film yang mereka tonton dapat bersifat positif atau negatif. Opini-opini ini sering ditemukan dalam bentuk review dan dapat dianalisis menggunakan teknik analisis sentimen. Dengan menggunakan analisis sentimen pada kumpulan review film, masyarakat dapat memperoleh rekomendasi tentang film-film yang layak ditonton. Salah satu platform yang populer untuk membaca ulasan dan review film adalah Internet Movie Database (IMDb), yang menyediakan informasi lengkap tentang berbagai film beserta ulasan pengguna. Dalam penelitian ini, dilakukan analisis sentimen review pengguna terhadap film dengan menggunakan algoritma Naive Bayes dan Logistic Regression. Dataset yang digunakan dalam penelitian ini diperoleh melalui proses scraping data review dari website IMDb. Selanjutnya, dataset tersebut menjalani tahapan preprocessing seperti pembersihan dan pengubahan format, serta dilakukan pelabelan sentimen menjadi positive dan negative berdasarkan review dan jumlah rating. Pengujian pada model algoritma dilakukan dengan menggunakan Confusion Matrix. Didapatkan bahwa algoritma Naïve Bayes menghasilkan akurasi sebesar 82% dan Logistic Regression sebesar 83%. Hasil ini menunjukkan bahwa algoritma Logistic Regression menghasilkan akurasi yang sedikit lebih baik, karena algoritma tersebut cocok digunakan untuk dapat menangani data yang tidak seimbang. Kata Kunci : Analisis Sentimen, Review Film, Klasifikasi, IMDb, Naïve Bayes, Logistic Regression

Item Type: Thesis (S1)
Call Number CD: FIK/INFO. 23 079
NIM/NIDN Creators: 41519010106
Uncontrolled Keywords: Analisis Sentimen, Review Film, Klasifikasi, IMDb, Naïve Bayes, Logistic Regression
Subjects: 000 Computer Science, Information and General Works/Ilmu Komputer, Informasi, dan Karya Umum > 000. Computer Science, Information and General Works/Ilmu Komputer, Informasi, dan Karya Umum > 003 Systems/Sistem-sistem
000 Computer Science, Information and General Works/Ilmu Komputer, Informasi, dan Karya Umum > 000. Computer Science, Information and General Works/Ilmu Komputer, Informasi, dan Karya Umum > 003 Systems/Sistem-sistem > 003.5 Computer Modeling and Simulation/Model dan Simulasi Komputer
000 Computer Science, Information and General Works/Ilmu Komputer, Informasi, dan Karya Umum > 000. Computer Science, Information and General Works/Ilmu Komputer, Informasi, dan Karya Umum > 004 Data Processing, Computer Science/Pemrosesan Data, Ilmu Komputer, Teknik Informatika
100 Philosophy and Psychology/Filsafat dan Psikologi > 150 Psychology/Psikologi > 154 Subconscious and Altered States and Process/Psikologi Bawah Sadar > 154.6 Sleep Phenomena/Fenomena Tidur > 154.63 Dreams/Mimpi > 154.634 Analysis/Analisis
Divisions: Fakultas Ilmu Komputer > Informatika
Depositing User: CALVIN PRASETYO
Date Deposited: 15 Sep 2023 08:00
Last Modified: 15 Sep 2023 08:00
URI: http://repository.mercubuana.ac.id/id/eprint/80962

Actions (login required)

View Item View Item