Electronic Theses and Dissertation

Universitas Syiah Kuala

SKRIPSI

DETEKSI DAN VISUALISASI KONTEN NEGATIF MELALUI PEMROSESAN AUDIO DI YOUTUBE: PERBANDINGAN INDOBERT DAN TEXTCNN DALAM KOMUNITAS GAME ONLINE INDONESIA

Pengarang

T. Malik Kamal - Personal Name;

Dosen Pembimbing

Alim Misbullah - 198806032019031011 - Dosen Pembimbing I
Zahnur - 196905291994031002 - Dosen Pembimbing II

Nomor Pokok Mahasiswa

2108107010007

Fakultas & Prodi

Fakultas MIPA / Informatika (S1) / PDDIKTI : 55201

Subject

DIGITAL PUBLICATIONS

Kata Kunci

VISUALISASI KONTEN NEGATIF
PEMROSESAN AUDIO
YOUTUBE
KOMUNITAS GAME ONLINE INDONESIA

Penerbit

Banda Aceh : Fakultas MIPA (S1)., 2025

Bahasa

Indonesia

No Classification

070.579 7

Literature Searching Service

Hard copy atau foto copy dari buku ini dapat diberikan dengan syarat ketentuan berlaku, jika berminat, silahkan hubungi via telegram (Chat Services LSS)

Fenomena konten negatif dalam komunitas game online di platform seperti YouTube menjadi isu serius karena dampaknya terhadap perilaku dan kesehatan mental
pengguna. Penelitian ini bertujuan membangun model klasifikasi untuk mendeteksi dan memahami konten negatif berdasarkan transkrip audio dari video YouTube berbahasa
Indonesia. Transkripsi dilakukan secara otomatis menggunakan model Faster-Whisper Large-v3, diikuti pelabelan otomatis dengan bantuan GPT dan validasi manual. Data
mencakup lima kategori, yaitu hate, offensive, racism, sexism, dan netral. Ketidakseimbangan distribusi data diatasi melalui teknik augmentasi back-translation.
Dua model deep learning, yaitu IndoBERT dan TextCNN, dilatih menggunakan data hasil preprocessing dan dievaluasi berdasarkan akurasi, precision, recall, dan F1-score.
Model IndoBERT menunjukkan performa terbaik dengan akurasi 89,99%, precision 79,50%, recall 56,82%, dan F1-score 63,74%. Sebaliknya, TextCNN mencatat akurasi
87,93%, precision 74,93%, recall 52,72%, dan F1-score 58,58%. Temuan ini menunjukkan bahwa penambahan data atau teknik augmentasi tidak selalu
meningkatkan performa model. Model terbaik diintegrasikan ke dalam antarmuka web berbasis Streamlit untuk analisis otomatis video YouTube. Visualisasi berbasis SHAP
juga ditambahkan guna menunjukkan kontribusi kata terhadap hasil klasifikasi. Penelitian ini menunjukkan bahwa pendekatan berbasis transkripsi audio dan deep
learning dapat menjadi solusi potensial dalam mengidentifikasi serta memahami konten negatif di komunitas game online Indonesia.

Abstrak Inggris

Negative content within online gaming communities on platforms such as YouTube has become a serious issue due to its impact on user behavior and mental health. This study aims to build a classification model to detect and understand negative content based on audio transcripts from Indonesian-language YouTube videos. Transcription was performed automatically using the Faster-Whisper Large-v3 model, followed by automated labeling assisted by GPT and manual validation. The data consists of five categories: hate, offensive, racism, sexism, and neutral. Data imbalance was addressed using back-translation augmentation techniques. Two deep learning models, IndoBERT and TextCNN, were trained on the preprocessed data and evaluated based on accuracy, precision, recall, and F1-score. IndoBERT achieved the best performance with an accuracy of 89.99%, precision of 79.50%, recall of 56.82%, and F1-score of 63.74%. In comparison, TextCNN recorded an accuracy of 87.93%, precision of 74.93%, recall of 52.72%, and F1-score of 58.58%. These findings indicate that data augmentation does not always lead to improved model performance. The best-performing model was integrated into a Streamlit-based web interface for automated analysis of YouTube videos. SHAP-based visualization was also implemented to show the contribution of words to the classification results. This study demonstrates that an audio transcription and deep learning-based approach can serve as a potential solution for identifying and understanding negative content in Indonesian online gaming communities.

Tulisan Relevan

PENGEMBANGAN MODEL KLASIFIKASI UNTUK DETEKSI DAN VISUALISASI CYBERBULLYING MELALUI PEMROSESAN AUDIO DI YOUTUBE (Muhammad Farhan, 2025)

PENERAPAN MODEL INDOBERT DALAM MENGANALISIS KONTEN VIDEO YOUTUBE BERDASARKAN KOMENTAR PENGGUNA (Ayu Aulia, 2025)

IMPLEMENTASI ROBERTA DAN INDOBERT DALAM ANALISIS SENTIMEN ISU PERKEMBANGAN EKONOMI INDONESIA DARI PLATFORM X DAN ARTIKEL BERITA ONLINE (Yoan Rifqi Candra, 2024)

PERBANDINGAN PERFORMA INDOBERT DAN DEEPSEEK DALAM PENDETEKSIAN HUMOR PADA TEKS BERBAHASA INDONESIA (Najla Raihana Kamila, 2025)

ANALISIS SENTIMEN ULASAN PENGGUNA TWITTER DAN ARTIKEL BERITA ONLINE TERHADAP DAMPAK CHATGPT DALAM BIDANG PENDIDIKAN (Muhammad Faris Adzkia, 2024)

APA Citation Style

Kamal, T. Malik .(2025). DETEKSI DAN VISUALISASI KONTEN NEGATIF MELALUI PEMROSESAN AUDIO DI YOUTUBE: PERBANDINGAN INDOBERT DAN TEXTCNN DALAM KOMUNITAS GAME ONLINE INDONESIA. Banda Aceh: Fakultas MIPA (S1).

Chicago/Turabian Citation Style

Kamal, T. Malik . DETEKSI DAN VISUALISASI KONTEN NEGATIF MELALUI PEMROSESAN AUDIO DI YOUTUBE: PERBANDINGAN INDOBERT DAN TEXTCNN DALAM KOMUNITAS GAME ONLINE INDONESIA. Banda Aceh: Fakultas MIPA (S1), 2025.

MLA Citation Style