IMPLEMENTASI MACHINE LEARNING DALAM ANALISIS SENTIMEN UJARAN KEBENCIAN DAN KEKERASAN VERBAL RNDI TWITTER | ELECTRONIC THESES AND DISSERTATION

Electronic Theses and Dissertation

Universitas Syiah Kuala

    SKRIPSI

IMPLEMENTASI MACHINE LEARNING DALAM ANALISIS SENTIMEN UJARAN KEBENCIAN DAN KEKERASAN VERBAL RNDI TWITTER


Pengarang
Dosen Pembimbing

Muhammad Subianto - 196812111994031005 - Dosen Pembimbing I
Zurnila Marli Kesuma - 196903061994122001 - Dosen Pembimbing II



Nomor Pokok Mahasiswa

2108108010001

Fakultas & Prodi

Fakultas MIPA / Statistika (S1) / PDDIKTI : 49201

Subject
-
Kata Kunci
-
Penerbit

Banda Aceh : Fakultas MIPA Statistika., 2024

Bahasa

No Classification

-

Literature Searching Service

Hard copy atau foto copy dari buku ini dapat diberikan dengan syarat ketentuan berlaku, jika berminat, silahkan hubungi via telegram (Chat Services LSS)

Pada peningkatan penggunaan media sosial, Twitter telah menjadi ruang utama bagi masyarakat untuk mengekspresikan opini. Namun, hal ini juga memicu maraknya penyebaran ujaran kebencian dan kekerasan verbal yang berpotensi mengganggu stabilitas sosial dan kenyamanan pengguna. Oleh karena itu, dilakukan penelitian ini dengan tujuan untuk mengembangkan model deteksi terhadap ujaran kebencian dan kekerasan verbal pada tweet berbahasa Indonesia, menggunakan beberapa algoritma machine learning, seperti Naive Bayes, Support Vector Machine (SVM), Random Forest, K-Nearest Neighbors (KNN), Decision Tree, dan Logistic Regression. Dataset terdiri dari 13.169 tweet yang mencakup 13 variabel. Tahapan pre-processing dilakukan untuk memastikan kualitas data optimal, sebelum data dibagi dengan rasio 90:10 untuk training dan testing. Berdasarkan nilai F1-score dan akurasi tertinggi, yaitu sebesar 0,83 dan 0,84 pada variabel ujaran kebencian, serta sebesar 0,90 dan 0,90 pada variabel kekerasan verbal, model SVM menunjukkan kinerja terbaik dalam mendeteksi ujaran kebencian dan kekerasan verbal. Sebaliknya, kinerja terendah ditunjukkan oleh model KNN. Analisis lebih lanjut menunjukkan bahwa ujaran kebencian di Twitter sering kali berisi istilah sensitif seperti "komunis", "asing", "kafir", serta kata-kata penghinaan seperti ”anjing” dan ”goblok”. Istilah-istilah ini mencerminkan isu-isu politik, agama, dan identitas nasional yang memperburuk perpecahan sosial. Dengan model SVM yang optimal, penelitian ini dapat menjadi solusi deteksi otomatis yang akurat dan efisien, mendukung moderasi konten, dan kebijakan pemerintah untuk menciptakan ruang digital yang lebih aman.

Kata Kunci: Twitter, Ujaran Kebencian, Kekerasan Verbal, Machine Learning, Support Vector Machine.

On the increasing use of social media, Twitter has become a key space for people to express their opinions. However, this also triggers the rampant spread of hate speech and verbal violence that has the potential to disrupt social stability and user comfort. Therefore, this study was conducted with the aim of developing a model for hate speech and verbal violence in Indonesian tweets, using several machine learning algorithms, such as Naive Bayes, Support Vector Machine (SVM), Random Forest, K-Nearest Neighbors (KNN), Decision Tree, and Logistic Regression. The dataset consists of 13,169 tweets covering 13 variables. The pre-processing stage is carried out to ensure optimal data quality, before the data is divided with a 90:10 ratio for training and testing. Based on the F1-score and the highest accuracy, which are 0.83 and 0.84 in the hate speech variable, and 0.90 and 0.90 in the verbal violence variable, the SVM model shows the best performance in detecting hate speech and verbal violence. In contrast, the lowest performance is indicated by the KNN model. Further analysis shows that hate speech on Twitter often contains sensitive terms such as "communist", "foreign", "infidel", as well as derogatory words such as "dog" and "idiot". These terms reflect political, religious, and national identity issues that exacerbate social divisions. With an optimized SVM model, this research can become an accurate and efficient automatic detection solution, supporting content moderation, and government policies to create a safer digital space. Keywords: Twitter, Hate Speech, Verbal Violence, Machine Learning, Support Vector Machine.

Citation



    SERVICES DESK