SIAGIAN, GOKLAS GEBRYEL (2024) Pengelompokan (Clustering) Data Tweet Pada Analisis Tanggapan Masyarakat Di Twitter (X) Terhadap Polusi Udara di Jakarta Menggunakan Algoritma K-Means. S1 thesis, Universitas Mercu Buana Jakarta - Menteng.
Text (COVER)
41520010216-GOKLAS GEBRYEL SIAGIAN-01 Cover - GOKLAS GEBRYEL SIAGIAN.pdf Download (390kB) |
|
Text (ABSTRAK)
41520010216-GOKLAS GEBRYEL SIAGIAN-02 Abstrak - GOKLAS GEBRYEL SIAGIAN.pdf Download (113kB) |
|
Text (BAB I)
41520010216-GOKLAS GEBRYEL SIAGIAN-03 Bab 1 - GOKLAS GEBRYEL SIAGIAN.pdf Restricted to Registered users only Download (119kB) |
|
Text (BAB II)
41520010216-GOKLAS GEBRYEL SIAGIAN-04 Bab 2 - GOKLAS GEBRYEL SIAGIAN.pdf Restricted to Registered users only Download (220kB) |
|
Text (BAB III)
41520010216-GOKLAS GEBRYEL SIAGIAN-05 Bab 3 - GOKLAS GEBRYEL SIAGIAN.pdf Restricted to Registered users only Download (180kB) |
|
Text (BAB IV)
41520010216-GOKLAS GEBRYEL SIAGIAN-06 Bab 4 - GOKLAS GEBRYEL SIAGIAN.pdf Restricted to Registered users only Download (386kB) |
|
Text (BAB V)
41520010216-GOKLAS GEBRYEL SIAGIAN-07 Bab 5 - GOKLAS GEBRYEL SIAGIAN.pdf Restricted to Registered users only Download (60kB) |
|
Text (DAFTAR PUSTAKA)
41520010216-GOKLAS GEBRYEL SIAGIAN-08 Daftar Pustaka - GOKLAS GEBRYEL SIAGIAN.pdf Restricted to Registered users only Download (173kB) |
|
Text (LAMPIRAN)
41520010216-GOKLAS GEBRYEL SIAGIAN-09 Lampiran - GOKLAS GEBRYEL SIAGIAN.pdf Restricted to Registered users only Download (878kB) |
|
Text (LEMBAR KEABSAHAN)
41520010216-GOKLAS GEBRYEL SIAGIAN-10 Hasil Scan Formulir Pernyataan Keabsahan dan Persetujuan Publikasi Tugas Akhir - GOKLAS GEBRYEL SIAGIAN.pdf Restricted to Repository staff only Download (225kB) |
Abstract
Polusi udara merupakan masalah lingkungan yang serius di kota-kota besar seperti Jakarta, yang dapat menyebabkan berbagai masalah kesehatan dan lingkungan. Dengan memanfaatkan data mining dan teknik clustering, penelitian ini mengelompokkan data tweet berdasarkan kesamaan konten untuk mengidentifikasi pola opini dan sentimen masyarakat terhadap polusi udara. Data tweet dikumpulkan dan diproses melalui beberapa tahap, termasuk pembersihan data, tokenisasi, dan penghapusan stopword. Algoritma K-Means kemudian diterapkan untuk mengelompokkan tweet-tweet tersebut menjadi beberapa klaster. Hasil clustering dievaluasi menggunakan metrik Silhouette Score untuk memastikan kualitas klaster yang dihasilkan. Hasil penelitian menunjukkan bahwa algoritma K-Means efektif dalam mengelompokkan tweet berdasarkan kesamaan konten, menghasilkan beberapa klaster yang menggambarkan variasi tanggapan masyarakat. Klaster-klaster ini memberikan wawasan tentang bagaimana masyarakat merespons isu polusi udara di Jakarta, yang dapat digunakan untuk perbaikan kebijakan lingkungan dan peningkatan kualitas udara. Penelitian ini diharapkan dapat memberikan kontribusi signifikan dalam literatur ilmiah terkait analisis teks dan lingkungan, serta menjadi referensi bagi penelitian dan pengembangan metode analisis clustering di masa depan. Air pollution is a serious environmental problem in big cities like Jakarta, which can cause various health and environmental problems. Utilising data mining and clustering techniques, this study groups tweet data based on content similarity to identify patterns of public opinion and sentiment towards air pollution. The tweet data is collected and processed through several stages, including data cleaning, tokenisation, and stopword removal. The K-Means algorithm is then applied to group the tweets into clusters. The clustering results are evaluated using the Silhouette Score metric to ensure the quality of the resulting clusters. The results show that the K-Means algorithm is effective in clustering tweets based on content similarity, resulting in several clusters that illustrate the variation of public responses. These clusters provide insights into how people respond to the issue of air pollution in Jakarta, which can be used for environmental policy improvement and air quality improvement. This research is expected to make a significant contribution to the scientific literature related to text analysis and the environment, as well as a reference for future research and development of clustering analysis methods.
Item Type: | Thesis (S1) |
---|---|
NIM/NIDN Creators: | 41520010216 |
Uncontrolled Keywords: | Clustering, Data mining, K-Means, Polusi udara,Twitter Clustering, Data mining, K-Means, Air pollution,Twitter |
Subjects: | 600 Technology/Teknologi > 600. Technology/Teknologi |
Divisions: | Fakultas Ilmu Komputer > Informatika |
Depositing User: | SILMI KAFFA MARISKA |
Date Deposited: | 28 Jun 2024 04:03 |
Last Modified: | 28 Jun 2024 04:03 |
URI: | http://repository.mercubuana.ac.id/id/eprint/89255 |
Actions (login required)
View Item |