TY - THES ID - umbprints96504 UR - http://repository.mercubuana.ac.id/96504/ A1 - NAFSYI, DHIAZ RUSYDA Y1 - 2025/07/19/ N2 - Interactions between people are often influenced by emotions, which are biological and psychological conditions and can be expressed through sound signals. This study aims to detect sound-based emotions by utilizing digital signal processing techniques. In this study, a performance comparison was conducted between two machine learning models, namely Long Short-Term Memory (LSTM) and Support Vector Machine (SVM) to complete the classification task of seven classes of emotions. This study used Toronto Emotional Speech Set (TESS) dataset, with MelFrequency Cepstral Coefficients (MFCC) feature extraction. The Data were divided into 2240 train data (80%) and 560 test data (20%). The test results showed that the LSTM model achieved superior performance with an accuracy of 98%, while the SVM model obtained an accuracy of 88%. It was concluded that the architecture on the LSTM is significantly more effective in capturing dynamic patterns of MFCC features. However, this study has one important limitation. Since the dataset used only comes from two speakers, the ability of the model to work well on more diverse sounds is still an area that needs to be proven in future studies . Kata kunci: Speech Emotion Recognition, MFCC, Long Short-Term Memory, Support Vector Machine. nteraksi antar manusia sering kali dipengaruhi oleh emosi, yang merupakan kondisi biologis dan psikologis serta dapat diekspresikan melalui sinyal suara. Penelitian ini bertujuan untuk mendeteksi emosi berbasis suara dengan memanfaatkan teknik pemrosesan sinyal digital. Dalam penelitian ini, dilakukan perbandingan kinerja antara dua model machine learning yaitu Long Short-Term Memory (LSTM) dan Support Vector Machine (SVM) untuk menyelesaikan tugas klasifikasi tujuh kelas emosi. Penelitian ini menggunakan dataset Toronto Emotional Speech Set (TESS), dengan ekstraksi fitur Mel-Frequency Cepstral Coefficients (MFCC). Data dibagi menjadi 2240 data latih 80% dan 560 data uji 20%. Hasil pengujian menunjukkan bahwa model LSTM mencapai kinerja superior dengan akurasi sebesar 98%, sementara model SVM memperoleh akurasi 88%. Disimpulkan bahwa arsitektur pada LSTM secara signifikan lebih efektif dalam menangkap pola dinamis dari fitur MFCC. Namun, penelitian ini memiliki satu batasan penting. Karena dataset yang digunakan hanya berasal dari dua pembicara, kemampuan model untuk bekerja dengan baik pada suara yang lebih beragam masih menjadi area yang perlu dibuktikan dalam penelitian selanjutnya. Kata kunci: Emosi, Klasifikasi, Long Short-Term Memory, Support Vector Machine, Mel Frequency Cepstral Coefficients PB - Universitas Mercu Buana Jakarta KW - Emosi KW - Klasifikasi KW - Long Short-Term Memory KW - Support Vector Machine KW - Mel Frequency Cepstral Coefficients M1 - s1 TI - IMPLEMENTASI METODE LONG SHORT-TERM MEMORY DAN SUPPORT VECTOR MACHINE DENGAN EKSTRAKSI FITUR MFCC UNTUK KLASIFIKASI EMOSI SUARA AV - restricted EP - 94 ER -