ANALISIS SENTIMEN PUBLIK PASCA 20 RNTAHUN GEMPA DAN TSUNAMI ACEH MENGGUNAKAN INDOBERT DAN NAIVE BAYES | ELECTRONIC THESES AND DISSERTATION

Electronic Theses and Dissertation

Universitas Syiah Kuala

    SKRIPSI

ANALISIS SENTIMEN PUBLIK PASCA 20 RNTAHUN GEMPA DAN TSUNAMI ACEH MENGGUNAKAN INDOBERT DAN NAIVE BAYES


Pengarang

Azran - Personal Name;

Dosen Pembimbing

Hizir - 196805311993031003 - Dosen Pembimbing I
Husaini - 198806242022031006 - Dosen Pembimbing II



Nomor Pokok Mahasiswa

2108107010074

Fakultas & Prodi

Fakultas MIPA / Informatika (S1) / PDDIKTI : 55201

Subject
-
Kata Kunci
-
Penerbit

Banda Aceh : Fakultas MIPA (S1)., 2026

Bahasa

No Classification

-

Literature Searching Service

Hard copy atau foto copy dari buku ini dapat diberikan dengan syarat ketentuan berlaku, jika berminat, silahkan hubungi via telegram (Chat Services LSS)

Gempa bumi berkekuatan 9,2 Skala Richter yang mengguncang Aceh pada 26 Desember
2004 dan diikuti oleh gelombang tsunami dahsyat menyebab lebih dari 173 ribu jiwa
meninggal dunia. Kejadian ini, menimbulkan dampak sosial dan psikologis yang
mendalam bagi masyarakat. Dua puluh tahun setelah peristiwa tersebut, perbincangan
publik mengenai tragedi ini masih aktif di berbagai platform digital, terutama media
sosial. Penelitian ini bertujuan untuk menganalisis sentimen publik 20 tahun gempa dan
tsunami Aceh dengan membandingkan dua model pembelajaran mesin, yaitu IndoBERT
dan Naive Bayes. Data diperoleh dari media sosial Twitter, YouTube, dan TikTok
untuk mengidentifikasi ekspresi opini masyarakat terhadap peristiwa bersejarah tersebut.
Dataset melalui tahap cleaning, augmentation (menggunakan synonym replacement
serta kombinasi synonym replacement–random swap), dan pelabelan sentimen menjadi
positif, negatif, dan netral. Hasil eksperimen menunjukkan bahwa model IndoBERT
dengan learning rate 1e−5 pada dataset kombinasi augmentasi menghasilkan performa
terbaik dengan akurasi sebesar 95%, sedangkan pada dataset synonym replacement
dengan learning rate 5e−6 akurasi yang diperoleh adalah 80%.Sementara itu, model
Naive Bayes menunjukkan hasil yang bervariasi tergantung pada teknik augmentasi
yang digunakan.Pada dataset kombinasi synonym replacement–random swap, model ini
mencapai akurasi tertinggi sebesar 86%, sedangkan pada dataset synonym replacement
akurasi yang diperoleh adalah 69%. Hal ini menunjukkan bahwa penambahan variasi
kata melalui kombinasi augmentasi mampu meningkatkan kemampuan generalisasi
model IndoBERT dan Naive Bayes.Temuan ini menunjukkan bahwa IndoBERT
memiliki kemampuan yang lebih unggul dalam memahami konteks dan semantik
bahasa Indonesia dibandingkan pendekatan probabilistik Naive Bayes. Penelitian ini
berkontribusi dalam pengembangan analisis sentimen berbasis bahasa Indonesia dan
dapat menjadi acuan dalam memahami pola komunikasi publik di media sosial terkait
peristiwa bersejarah berskala besar seperti bencana alam.

Kata Kunci: Analisis Sentimen, IndoBERT, Naive Bayes, Tsunami Aceh, Pembelajaran
Mesin.

The 9.2-magnitude earthquake that struck Aceh on December 26, 2004, followed by a devastating tsunami, resulted in more than 173,000 fatalities. This event had a profound social and psychological impact on the affected communities. Twenty years after the disaster, public discussions regarding this tragedy remain active across various digital platforms, particularly social media. This study aims to analyze public sentiment twenty years after the Aceh earthquake and tsunami by comparing two machine learning models, namely IndoBERT and Naive Bayes. Data were obtained from social media platforms, including Twitter, YouTube, and TikTok, to identify public opinion related to this historical event. The dataset underwent several preprocessing stages, including text cleaning, data augmentation using synonym replacement and a combination of synonym replacement and random swap, as well as sentiment labeling into positive, negative, and neutral categories. Experimental results show that the IndoBERT model achieved the best performance with an accuracy of 95% using a learning rate of 1e−5 on the combined augmented dataset. Meanwhile, an accuracy of 80% was obtained on the synonym replacement dataset with a learning rate of 5e−6. The Naive Bayes model demonstrated varying performance depending on the augmentation technique applied. On the synonym replacement–random swap dataset, the model achieved its highest accuracy of 86%, whereas an accuracy of 69% was obtained on the synonym replacement dataset. These results indicate that increasing lexical variation through combined augmentation techniques improves the generalization capabilities of both the IndoBERT and Naive Bayes models. Furthermore, the findings demonstrate that IndoBERT exhibits superior performance in capturing contextual and semantic information in the Indonesian language compared to the probabilistic Naive Bayes approach. This research contributes to the development of Indonesian language-based sentiment analysis and may serve as a reference for understanding public communication patterns on social media related to large-scale historical events such as natural disasters. Keywords: Sentiment Analysis, IndoBERT, Naive Bayes, Aceh Tsunami, Machine Learning.

Citation



    SERVICES DESK