Electronic Theses and Dissertation
Universitas Syiah Kuala
SKRIPSI
ANALISIS SENTIMEN PUBLIK PASCA 20 RNTAHUN GEMPA DAN TSUNAMI ACEH MENGGUNAKAN INDOBERT DAN NAIVE BAYES
Pengarang
Azran - Personal Name;
Dosen Pembimbing
Nomor Pokok Mahasiswa
2108107010074
Fakultas & Prodi
Fakultas MIPA / Informatika (S1) / PDDIKTI : 55201
Subject
Kata Kunci
Penerbit
Banda Aceh : Fakultas MIPA (S1)., 2026
Bahasa
No Classification
-
Literature Searching Service
Hard copy atau foto copy dari buku ini dapat diberikan dengan syarat ketentuan berlaku, jika berminat, silahkan hubungi via telegram (Chat Services LSS)
Gempa bumi berkekuatan 9,2 Skala Richter yang mengguncang Aceh pada 26 Desember
2004 dan diikuti oleh gelombang tsunami dahsyat menyebab lebih dari 173 ribu jiwa
meninggal dunia. Kejadian ini, menimbulkan dampak sosial dan psikologis yang
mendalam bagi masyarakat. Dua puluh tahun setelah peristiwa tersebut, perbincangan
publik mengenai tragedi ini masih aktif di berbagai platform digital, terutama media
sosial. Penelitian ini bertujuan untuk menganalisis sentimen publik 20 tahun gempa dan
tsunami Aceh dengan membandingkan dua model pembelajaran mesin, yaitu IndoBERT
dan Naive Bayes. Data diperoleh dari media sosial Twitter, YouTube, dan TikTok
untuk mengidentifikasi ekspresi opini masyarakat terhadap peristiwa bersejarah tersebut.
Dataset melalui tahap cleaning, augmentation (menggunakan synonym replacement
serta kombinasi synonym replacement–random swap), dan pelabelan sentimen menjadi
positif, negatif, dan netral. Hasil eksperimen menunjukkan bahwa model IndoBERT
dengan learning rate 1e−5 pada dataset kombinasi augmentasi menghasilkan performa
terbaik dengan akurasi sebesar 95%, sedangkan pada dataset synonym replacement
dengan learning rate 5e−6 akurasi yang diperoleh adalah 80%.Sementara itu, model
Naive Bayes menunjukkan hasil yang bervariasi tergantung pada teknik augmentasi
yang digunakan.Pada dataset kombinasi synonym replacement–random swap, model ini
mencapai akurasi tertinggi sebesar 86%, sedangkan pada dataset synonym replacement
akurasi yang diperoleh adalah 69%. Hal ini menunjukkan bahwa penambahan variasi
kata melalui kombinasi augmentasi mampu meningkatkan kemampuan generalisasi
model IndoBERT dan Naive Bayes.Temuan ini menunjukkan bahwa IndoBERT
memiliki kemampuan yang lebih unggul dalam memahami konteks dan semantik
bahasa Indonesia dibandingkan pendekatan probabilistik Naive Bayes. Penelitian ini
berkontribusi dalam pengembangan analisis sentimen berbasis bahasa Indonesia dan
dapat menjadi acuan dalam memahami pola komunikasi publik di media sosial terkait
peristiwa bersejarah berskala besar seperti bencana alam.
Kata Kunci: Analisis Sentimen, IndoBERT, Naive Bayes, Tsunami Aceh, Pembelajaran
Mesin.
The 9.2-magnitude earthquake that struck Aceh on December 26, 2004, followed by a devastating tsunami, resulted in more than 173,000 fatalities. This event had a profound social and psychological impact on the affected communities. Twenty years after the disaster, public discussions regarding this tragedy remain active across various digital platforms, particularly social media. This study aims to analyze public sentiment twenty years after the Aceh earthquake and tsunami by comparing two machine learning models, namely IndoBERT and Naive Bayes. Data were obtained from social media platforms, including Twitter, YouTube, and TikTok, to identify public opinion related to this historical event. The dataset underwent several preprocessing stages, including text cleaning, data augmentation using synonym replacement and a combination of synonym replacement and random swap, as well as sentiment labeling into positive, negative, and neutral categories. Experimental results show that the IndoBERT model achieved the best performance with an accuracy of 95% using a learning rate of 1e−5 on the combined augmented dataset. Meanwhile, an accuracy of 80% was obtained on the synonym replacement dataset with a learning rate of 5e−6. The Naive Bayes model demonstrated varying performance depending on the augmentation technique applied. On the synonym replacement–random swap dataset, the model achieved its highest accuracy of 86%, whereas an accuracy of 69% was obtained on the synonym replacement dataset. These results indicate that increasing lexical variation through combined augmentation techniques improves the generalization capabilities of both the IndoBERT and Naive Bayes models. Furthermore, the findings demonstrate that IndoBERT exhibits superior performance in capturing contextual and semantic information in the Indonesian language compared to the probabilistic Naive Bayes approach. This research contributes to the development of Indonesian language-based sentiment analysis and may serve as a reference for understanding public communication patterns on social media related to large-scale historical events such as natural disasters. Keywords: Sentiment Analysis, IndoBERT, Naive Bayes, Aceh Tsunami, Machine Learning.
ANALISIS SENTIMEN TERHADAP APLIKASI BELAJAR ONLINE BERDASARKAN DATA ULASAN APLIKASI PLAY STORE (Muhammad Rizky Hidayah Akbar, 2025)
PERBANDINGAN KINERJA METODE KLASIFIKASI MENGGUNAKAN FEATURE SELECTION PADA ANALISIS SENTIMEN SMARTPHONE (GHIYALTI NOVILIA, 2023)
ANALISIS SENTIMEN BERBASIS LEXICON BASED DENGAN ALGORITMA NAIVE BAYES TERHADAP KOMENTAR NETIZEN PADA VIDEO YOUTUBE DEBAT CAPRES/CAWAPRES DALAM PEMILU 2024 (Reza Fahrevi, 2024)
ANALISIS SENTIMEN PADA REVIEW HOTEL DENGAN TEKS BAHASA INDONESIA MENGGUNAKAN MACHINE LEARNING (NURHAFNITA, 2023)
PENGEMBANGAN SISTEM CERDAS ANALISIS SENTIMEN ARTIKEL BERITA DAN MEDIA SOSIAL X MENGGUNAKAN ALGORITMA INDOBERT DAN ROBERTA (, 2025)