SIREGAR, ADI FARANT (2024) PENERAPAN DATA MINING UNTUK MENGESTIMASI LAJU PERTUMBUHAN PENDUDUK PROVINSI JAWA BARAT MENGGUNAKAN METODE REGRESI LINIER BERGANDA. S1 thesis, Universitas Mercu Buana Jakarta.
Text (JURNAL MAHASISWA)
jurnal 41517310007 ADI FARANT SIREGAR.pdf Restricted to Registered users only Download (2MB) |
Abstract
This research aims to analyze population growth estimation in West Java Province, focusing on the relationship between the year, births, and population. The study utilizes a quantitative approach with a multiple linear regression model implemented in Python. The primary objectives are to understand the influence of variables on population growth and predict future growth rates. The independent variables include Year (X1) and Births (X2), while the dependent variable is Population (Y). The dataset spans from 2013 to 2020, sourced from Open Data Jabar. The sample consists of historical population data for West Java. The research employs a systematic data mining process, specifically the CRISP-DM methodology. The analysis includes correlation testing, hypothesis testing, and model evaluation. The findings indicate a strong positive correlation between the year and population, signifying a significant increase over time. However, the correlation between births and population is not statistically significant. Model evaluation using Mean Squared Error (MSE) and Mean Absolute Error (MAE) suggests satisfactory accuracy with potential for refinement. In conclusion, the study recommends expanding the model by considering additional influential variables. Periodic validation with newer data is advised, and collaboration with experts in related fields can enhance the understanding of population growth dynamics. Keywords: population growth, multiple linear regression, Python, CRISP-DM, correlation, model evaluation. Penelitian ini bertujuan menganalisis estimasi pertumbuhan penduduk di Provinsi Jawa Barat dengan fokus pada hubungan antara tahun, kelahiran, dan jumlah penduduk. Pendekatan kuantitatif digunakan dengan model regresi linear berganda. Tujuan utama penelitian ini adalah memahami pengaruh variabel terhadap pertumbuhan penduduk dan memprediksi laju pertumbuhan masa depan. Variabel independen melibatkan Tahun (X1) dan Kelahiran (X2), sedangkan variabel dependennya adalah Jumlah Penduduk (Y). Dataset melibatkan periode tahun 2013-2020 yang diperoleh dari Open Data Jabar. Sampel terdiri dari data historis jumlah penduduk Jawa Barat. Penelitian menggunakan pendekatan data mining regresi linier berganda, khususnya metodologi CRISP-DM. Analisis melibatkan pengujian korelasi, uji hipotesis, dan evaluasi model. Hasil penelitian menunjukkan korelasi positif yang kuat antara tahun dan jumlah penduduk, menandakan peningkatan yang signifikan dari waktu ke waktu. Namun, korelasi antara kelahiran dan jumlah penduduk tidak signifikan secara statistik. Evaluasi model menggunakan Mean Squared Error (MSE) dan Mean Absolute Error (MAE) menunjukkan tingkat akurasi yang memadai dengan potensi penyempurnaan. Sebagai kesimpulan, penelitian merekomendasikan perluasan model dengan mempertimbangkan variabel tambahan yang mempengaruhi. Validasi periodik dengan data terbaru, dan kolaborasi dengan ahli di bidang terkait dapat meningkatkan pemahaman dinamika pertumbuhan penduduk. Kata Kunci: pertumbuhan penduduk, regresi linear berganda, Python, CRISP-DM, korelasi, evaluasi model.
Actions (login required)
View Item |