PERBANDINGAN ALGORITMA C4.5 DAN ALGORITMA NAIVE BAYES DALAM DATA MINING UNTUK MEMPREDIKSI PENJUALAN KOSMETIK DI TOKO JOLITA

SAPUTRA, HENDI (2024) PERBANDINGAN ALGORITMA C4.5 DAN ALGORITMA NAIVE BAYES DALAM DATA MINING UNTUK MEMPREDIKSI PENJUALAN KOSMETIK DI TOKO JOLITA. S1 thesis, Universitas Mercu Buana Jakarta.

[img]
Preview
Text (HAL COVER)
01 COVER.pdf

Download (481kB) | Preview
[img] Text (BAB I)
02 BAB 1.pdf
Restricted to Registered users only

Download (34kB)
[img] Text (BAB II)
03 BAB 2.pdf
Restricted to Registered users only

Download (73kB)
[img] Text (BAB III)
04 BAB 3.pdf
Restricted to Registered users only

Download (38kB)
[img] Text (BAB IV)
05 BAB 4.pdf
Restricted to Registered users only

Download (290kB)
[img] Text (BAB V)
06 BAB 5.pdf
Restricted to Registered users only

Download (27kB)
[img] Text (DAFTAR PUSTAKA)
07 DAFTAR PUSTAKA.pdf
Restricted to Registered users only

Download (122kB)
[img] Text (LAMPIRAN)
08 LAMPIRAN.pdf
Restricted to Registered users only

Download (1MB)

Abstract

This research aims to help predict problems that occur at Jolita stores where this store sells beauty products. Often times this store runs out of product stock which makes customers not get the product they are looking for, so researchers conducted research to help find out which products are most in demand by using two algorithms, namely the C4.5 algorithm and the Naive Bayes algorithm. Performance evaluation shows that Wardah products are the most in demand where Jolita store sales data using the C4.5 algorithm and Naive Bayes obtained confusion matrix results of C4.5 testing the accuracy obtained is 0.99 this model works very well on training data, with very small prediction errors and excellent ability to explain data variations. However, it is important to also check the model's performance on test data to ensure the model is not overfitting, i.e. performing very well on training data but less well on data that has not been seen before. Of the two algorithms when viewed from the accuracy results, C4.5 is better than the Naive Bayes algorithm. In addition, the Naive Bayes algorithm is not suitable for use in this study because it does not work well on training data. The errors (MAE and MSE) are relatively high, and the R² Score of 0.00 indicates that the model has no ability to predict or explain variations in the target data. In other words, the model fails to learn from the training data and its predictions are no better than a simple average. This can happen because the model is too simple (underfitting) or there is a problem in feature or model selection. Keyword: Store Jolita, C4.5, Naive Bayes – Penelitian ini bertujuan untuk membantu memprediksi permasalah yang terjadi pada toko Jolita dimana toko ini menjual produk kecantikan. Sering kali toko ini kehabisan stok produk yang membuat pelanggan tidak mendapatkan produk yang dicarinya, maka peneliti melakukan penelitian untuk membantu mencari tahu produk mana saja yang paling banyak diminati pelanggan dengan menggunakan dua algoritma yaitu algoritma C4.5 dan algoritma Naive Bayes. Evaluasi kinerja menunjukan bahwa produk wardah yang paling banyak diminati dimana data penjualan toko Jolita menggunakan algoritma C4.5 dan Naive Bayes didapatkan hasil confusion matrix pengujian C4.5 akurasi yang di dapatkan yaitu 0.99 model ini bekerja sangat baik pada data pelatihan, dengan kesalahan prediksi yang sangat kecil dan kemampuan yang sangat baik untuk menjelaskan variasi data. Namun, penting untuk juga memeriksa kinerja model pada data pengujian untuk memastikan model tidak overfitting, yaitu performa yang sangat baik pada data pelatihan tetapi kurang baik pada data yang belum dilihat sebelumnya.. Dari dua algoritma jika dilihat dari hasil akurasi maka C4.5 lebih baik dibandingkan dengan algoritma Naive Bayes. Disamping itu algoritma Naive Bayes tidak cocok digunakan pada penelitian ini karna tidak bekerja dengan baik pada data pelatihan. Kesalahan (MAE dan MSE) relatif tinggi, dan R² Score 0,00 menunjukkan bahwa model tidak memiliki kemampuan untuk memprediksi atau menjelaskan variasi data target. Dengan kata lain, model gagal dalam belajar dari data pelatihan dan prediksinya tidak lebih baik dari sekadar rata-rata sederhana. Ini bisa terjadi karena model terlalu sederhana (underfitting) atau ada masalah dalam pemilihan fitur atau model. Kata kunci: Toko Jolita, C4.5, Naive Bayes

Item Type: Thesis (S1)
Call Number CD: FIK/INFO. 24 218
NIM/NIDN Creators: 41518010020
Uncontrolled Keywords: Toko Jolita, C4.5, Naive Bayes
Subjects: 500 Natural Science and Mathematics/Ilmu-ilmu Alam dan Matematika > 510 Mathematics/Matematika > 518 Numerical Analysis/Analisis Numerik, Analisa Numerik > 518.1 Algorithms/Algoritma
600 Technology/Teknologi > 660 Chemical Engineering and Related Technologies/Teknologi Kimia dan Ilmu yang Berkaitan > 668 Technology of Other Organic Products/Teknologi Produk Organik Lainnya > 668.5 Parfumes and Cosmetics/Teknologi Parfum, Minyak Wangi dan Kosmetik
Divisions: Fakultas Ilmu Komputer > Informatika
Depositing User: khalimah
Date Deposited: 01 Oct 2024 04:25
Last Modified: 01 Oct 2024 04:25
URI: http://repository.mercubuana.ac.id/id/eprint/91979

Actions (login required)

View Item View Item