Electronic Theses and Dissertation
Universitas Syiah Kuala
SKRIPSI
ANALISIS PERBANDINGAN BERT, ROBERTA, DAN DISTILBERT DALAM KLASIFIKASI SENTIMEN KOMENTAR FILM
Pengarang
Meutia Aini - Personal Name;
Dosen Pembimbing
Kikye Martiwi Sukiakhy - 198605202019032009 - Dosen Pembimbing I
Zulfan - 198606022015041003 - Dosen Pembimbing II
Nomor Pokok Mahasiswa
2208107010005
Fakultas & Prodi
Fakultas MIPA / Informatika (S1) / PDDIKTI : 55201
Subject
Kata Kunci
Penerbit
Banda Aceh : Fakultas mipa., 2026
Bahasa
No Classification
-
Literature Searching Service
Hard copy atau foto copy dari buku ini dapat diberikan dengan syarat ketentuan berlaku, jika berminat, silahkan hubungi via telegram (Chat Services LSS)
Analisis sentimen ulasan film secara manual menjadi tidak efisien akibat volume data yang terus meningkat di platform seperti IMDb. Penelitian ini bertujuan untuk menerapkan dan membandingkan performa model Transformer yaitu BERT, RoBERTa, dan DistilBERT dalam melakukan klasifikasi sentimen ulasan film ke dalam tiga kategori yaitu positif, netral, dan negatif, serta mengimplementasikan model terbaik ke dalam aplikasi web berbasis Streamlit. Data dikumpulkan menggunakan teknik web scraping pada situs IMDb dan menghasilkan 11.380 data ulasan film. Pelabelan data dilakukan secara otomatis menggunakan model LLM LLaMA 3.1 8B Instant melalui API Groq dengan tingkat akurasi validasi sebesar 94,33%. Ketiga model dilatih menggunakan teknik fine-tuning dengan konfigurasi hyperparameter yang sama menggunakan framework HuggingFace Transformers dan PyTorch. Hasil evaluasi menunjukkan bahwa model RoBERTa memperoleh performa terbaik dengan nilai Accuracy sebesar 91,87% dan F1-Score sebesar 86,07%, diikuti oleh BERT dengan Accuracy sebesar 89,28% dan F1-Score sebesar 83,05%, serta DistilBERT dengan Accuracy sebesar 86,86% dan F1-Score sebesar 79,91%. Selain itu, model hasil fine-tuning diimplementasikan ke dalam aplikasi Streamlit yang memungkinkan pengguna melakukan prediksi sentimen ulasan film secara interaktif.
Manual sentiment analysis of movie reviews has become inefficient due to the increasing volume of data on platforms such as IMDb. This study aims to apply and compare the performance of Transformer models, namely BERT, RoBERTa, and DistilBERT, in classifying movie review sentiment into three categories: positive, neutral, and negative, as well as implementing the models into a Streamlit-based web application. Data were collected using web scraping techniques on the IMDb website, resulting in 11,380 movie review records. Data labeling was performed automatically using the LLaMA 3.1 8B Instant LLM model via the Groq API, achieving a validation accuracy of 94.33%. All three models were trained using fine-tuning with identical hyperparameter configurations using the HuggingFace Transformers framework and PyTorch. Evaluation results show that RoBERTa achieved the best performance with an Accuracy of 91.87% and an F1-Score of 86.07%, followed by BERT with an Accuracy of 89.28% and an F1-Score of 83.05%, and DistilBERT with an Accuracy of 86.86% and an F1-Score of 79.91%. The fine-tuned models were subsequently deployed into a Streamlit web application that allows users to perform movie review sentiment prediction interactively.
ANALISIS SENTIMEN MASYARAKAT TERHADAP TIM NASIONAL SEPAK BOLA INDONESIA DI INSTAGRAM MENGGUNAKAN ALGORITMA ROBERTA, DISTILBERT, DAN INDOBERT (Rahmi Najla, 2025)
IMPLEMENTASI ROBERTA DAN INDOBERT DALAM ANALISIS SENTIMEN ISU PERKEMBANGAN EKONOMI INDONESIA DARI PLATFORM X DAN ARTIKEL BERITA ONLINE (Yoan Rifqi Candra, 2024)
PENGEMBANGAN SISTEM CERDAS ANALISIS SENTIMEN ARTIKEL BERITA DAN MEDIA SOSIAL X MENGGUNAKAN ALGORITMA INDOBERT DAN ROBERTA (, 2025)
SISTEM VISUALISASI ANALISIS EMOSI PADA KOMENTAR VIDEO TIKTOK DAN YOUTUBE MENGGUNAKAN MODEL DISTILBERT (Muhammad Akbarul Ihsan, 2026)
ANALISIS SENTIMEN PENGGUNA APLIKASI TIKTOK TERHADAP PRODUK SUNSCREEN ATAU TABIR SURYA MENGGUNAKAN ALGORITMA SUPPORT VECTOR MACHINE, NAIVE BAYES CLASSIFIER DAN RANDOM FOREST (Ulan Sawalia, 2025)