PERBANDINGAN METODE SVM, NAIVE BAYES DAN INDOBERT DALAM MENDETEKSI UJARAN KEBENCIAN MENGGUNAKAN DATASET MULTI-LABEL BERBAHASA INDONESIA

PERBANDINGAN METODE SVM, NAIVE BAYES DAN INDOBERT DALAM MENDETEKSI UJARAN KEBENCIAN MENGGUNAKAN DATASET MULTI-LABEL BERBAHASA INDONESIA Ricky Bagestra Primary Author mixed material bibliography Banda Aceh Fakultas MIPA Informatika 2024 Penelitian ini bertujuan untuk membandingkan performa metode Support Vector Machine (SVM), Naive Bayes, dan IndoBERT dalam deteksi ujaran kebencian pada dataset multi-label berbahasa Indonesia. Dataset yang digunakan berasal dari penelitian Ibrohim dan Budi (2019), terdiri dari 13.169 tweet dengan 12 label. Proses pre-processing data dilakukan untuk mempersiapkan dataset, mencakup case folding, penghapusan karakter yang tidak diperlukan, normalisasi kata alay, stemming, dan penghapusan stopword. Perbandingan performa dilakukan sebelum dan sesudah proses tuning untuk setiap metode. Faktor-faktor yang mempengaruhi performa masing- masing metode dianalisis, meliputi karakteristik dataset, fitur bahasa, teknik pra- pemrosesan, arsitektur model, dan ketersediaan sumber daya komputasi. Penanganan ketidakseimbangan kelas menggunakan teknik augmentasi data berbasis BERT juga dievaluasi dampaknya terhadap performa metode. Hasil penelitian menunjukkan bahwa metode IndoBERT memberikan performa terbaik setelah tuning, dengan akurasi 93%, F1-score 91%, recall 91%, dan precision 91%. SVM dan Naive Bayes juga mengalami peningkatan performa setelah tuning, meskipun tidak sebaik IndoBERT. Augmentasi data berbasis BERT terbukti efektif dalam meningkatkan performa semua metode. Model terbaik diimplementasikan dalam interface web menggunakan framework Flask untuk memudahkan pengguna dalam mendeteksi ujaran kebencian pada teks berbahasa Indonesia. Penelitian ini memberikan kontribusi pada pengembangan sistem deteksi ujaran kebencian yang lebih akurat dan efisien, serta memberikan wawasan tentang faktor-faktor yang mempengaruhi performa metode dalam konteks bahasa Indonesia. Kata kunci: Deteksi Ujaran Kebencian, Bahasa Kasar, Support Vector Machine, Naive Bayes, IndoBERT. 0 ELECTRONIC THESES AND DISSERTATION Universitas Syiah Kuala 142063 2024-12-02 15:12:57 2024-12-02 15:58:29 machine generated