Gempa bumi berkekuatan 9,2 skala richter yang mengguncang aceh pada 26 desember 2004 dan diikuti oleh gelombang tsunami dahsyat menyebab lebih dari 173 ribu jiwa meninggal dunia. kejadian ini, menimbulkan dampak sosial dan psikologis yang mendalam bagi masyarakat. dua puluh tahun setelah peristiwa tersebut, perbincangan publik mengenai tragedi ini masih aktif di berbagai platform digital, terutama media sosial. penelitian ini bertujuan untuk menganalisis sentimen publik 20 tahun gempa dan tsunami aceh dengan membandingkan dua model pembelajaran mesin, yaitu indobert dan naive bayes. data diperoleh dari media sosial twitter, youtube, dan tiktok untuk mengidentifikasi ekspresi opini masyarakat terhadap peristiwa bersejarah tersebut. dataset melalui tahap cleaning, augmentation (menggunakan synonym replacement serta kombinasi synonym replacement–random swap), dan pelabelan sentimen menjadi positif, negatif, dan netral. hasil eksperimen menunjukkan bahwa model indobert dengan learning rate 1e−5 pada dataset kombinasi augmentasi menghasilkan performa terbaik dengan akurasi sebesar 95%, sedangkan pada dataset synonym replacement dengan learning rate 5e−6 akurasi yang diperoleh adalah 80%.sementara itu, model naive bayes menunjukkan hasil yang bervariasi tergantung pada teknik augmentasi yang digunakan.pada dataset kombinasi synonym replacement–random swap, model ini mencapai akurasi tertinggi sebesar 86%, sedangkan pada dataset synonym replacement akurasi yang diperoleh adalah 69%. hal ini menunjukkan bahwa penambahan variasi kata melalui kombinasi augmentasi mampu meningkatkan kemampuan generalisasi model indobert dan naive bayes.temuan ini menunjukkan bahwa indobert memiliki kemampuan yang lebih unggul dalam memahami konteks dan semantik bahasa indonesia dibandingkan pendekatan probabilistik naive bayes. penelitian ini berkontribusi dalam pengembangan analisis sentimen berbasis bahasa indonesia dan dapat menjadi acuan dalam memahami pola komunikasi publik di media sosial terkait peristiwa bersejarah berskala besar seperti bencana alam. kata kunci: analisis sentimen, indobert, naive bayes, tsunami aceh, pembelajaran mesin.
Electronic Theses and Dissertation
Universitas Syiah Kuala
SKRIPSI
ANALISIS SENTIMEN PUBLIK PASCA 20 RNTAHUN GEMPA DAN TSUNAMI ACEH MENGGUNAKAN INDOBERT DAN NAIVE BAYES. Banda Aceh Fakultas MIPA (S1),2026
Baca Juga : ANALISIS SENTIMEN BERBASIS LEXICON BASED DENGAN ALGORITMA NAIVE BAYES TERHADAP KOMENTAR NETIZEN PADA VIDEO YOUTUBE DEBAT CAPRES/CAWAPRES DALAM PEMILU 2024 (Reza Fahrevi, 2024)
Abstract
The 9.2-magnitude earthquake that struck Aceh on December 26, 2004, followed by a devastating tsunami, resulted in more than 173,000 fatalities. This event had a profound social and psychological impact on the affected communities. Twenty years after the disaster, public discussions regarding this tragedy remain active across various digital platforms, particularly social media. This study aims to analyze public sentiment twenty years after the Aceh earthquake and tsunami by comparing two machine learning models, namely IndoBERT and Naive Bayes. Data were obtained from social media platforms, including Twitter, YouTube, and TikTok, to identify public opinion related to this historical event. The dataset underwent several preprocessing stages, including text cleaning, data augmentation using synonym replacement and a combination of synonym replacement and random swap, as well as sentiment labeling into positive, negative, and neutral categories. Experimental results show that the IndoBERT model achieved the best performance with an accuracy of 95% using a learning rate of 1e−5 on the combined augmented dataset. Meanwhile, an accuracy of 80% was obtained on the synonym replacement dataset with a learning rate of 5e−6. The Naive Bayes model demonstrated varying performance depending on the augmentation technique applied. On the synonym replacement–random swap dataset, the model achieved its highest accuracy of 86%, whereas an accuracy of 69% was obtained on the synonym replacement dataset. These results indicate that increasing lexical variation through combined augmentation techniques improves the generalization capabilities of both the IndoBERT and Naive Bayes models. Furthermore, the findings demonstrate that IndoBERT exhibits superior performance in capturing contextual and semantic information in the Indonesian language compared to the probabilistic Naive Bayes approach. This research contributes to the development of Indonesian language-based sentiment analysis and may serve as a reference for understanding public communication patterns on social media related to large-scale historical events such as natural disasters. Keywords: Sentiment Analysis, IndoBERT, Naive Bayes, Aceh Tsunami, Machine Learning.
Baca Juga : IDENTIFIKASI FAKTOR-FAKTOR YANG MEMENGARUHI KELUARGA BERISIKO STUNTING DI KOTA BANDA ACEH DAN SUBULUSSALAM DENGAN MENGGUNAKAN METODE NAÏVE BAYES DAN NAÏVE BAYES ADABOOST (NAZIRA SAFWANI JUNAIDI, 2025)