Analisis sentimen ulasan film secara manual menjadi tidak efisien akibat volume data yang terus meningkat di platform seperti imdb. penelitian ini bertujuan untuk menerapkan dan membandingkan performa model transformer yaitu bert, roberta, dan distilbert dalam melakukan klasifikasi sentimen ulasan film ke dalam tiga kategori yaitu positif, netral, dan negatif, serta mengimplementasikan model terbaik ke dalam aplikasi web berbasis streamlit. data dikumpulkan menggunakan teknik web scraping pada situs imdb dan menghasilkan 11.380 data ulasan film. pelabelan data dilakukan secara otomatis menggunakan model llm llama 3.1 8b instant melalui api groq dengan tingkat akurasi validasi sebesar 94,33%. ketiga model dilatih menggunakan teknik fine-tuning dengan konfigurasi hyperparameter yang sama menggunakan framework huggingface transformers dan pytorch. hasil evaluasi menunjukkan bahwa model roberta memperoleh performa terbaik dengan nilai accuracy sebesar 91,87% dan f1-score sebesar 86,07%, diikuti oleh bert dengan accuracy sebesar 89,28% dan f1-score sebesar 83,05%, serta distilbert dengan accuracy sebesar 86,86% dan f1-score sebesar 79,91%. selain itu, model hasil fine-tuning diimplementasikan ke dalam aplikasi streamlit yang memungkinkan pengguna melakukan prediksi sentimen ulasan film secara interaktif.
Electronic Theses and Dissertation
Universitas Syiah Kuala
SKRIPSI
ANALISIS PERBANDINGAN BERT, ROBERTA, DAN DISTILBERT DALAM KLASIFIKASI SENTIMEN KOMENTAR FILM. Banda Aceh Fakultas mipa,2026
Baca Juga : PENGEMBANGAN SISTEM CERDAS ANALISIS SENTIMEN ARTIKEL BERITA DAN MEDIA SOSIAL X MENGGUNAKAN ALGORITMA INDOBERT DAN ROBERTA (, 2025)
Abstract
Manual sentiment analysis of movie reviews has become inefficient due to the increasing volume of data on platforms such as IMDb. This study aims to apply and compare the performance of Transformer models, namely BERT, RoBERTa, and DistilBERT, in classifying movie review sentiment into three categories: positive, neutral, and negative, as well as implementing the models into a Streamlit-based web application. Data were collected using web scraping techniques on the IMDb website, resulting in 11,380 movie review records. Data labeling was performed automatically using the LLaMA 3.1 8B Instant LLM model via the Groq API, achieving a validation accuracy of 94.33%. All three models were trained using fine-tuning with identical hyperparameter configurations using the HuggingFace Transformers framework and PyTorch. Evaluation results show that RoBERTa achieved the best performance with an Accuracy of 91.87% and an F1-Score of 86.07%, followed by BERT with an Accuracy of 89.28% and an F1-Score of 83.05%, and DistilBERT with an Accuracy of 86.86% and an F1-Score of 79.91%. The fine-tuned models were subsequently deployed into a Streamlit web application that allows users to perform movie review sentiment prediction interactively.
Baca Juga : DETEKSI CYBERBULLYING YANG BERSIFAT RNMISOGINIS PADA KOMENTAR TIKTOK RNMENGGUNAKAN MODEL INDOBERT (Laila Asrin, 2025)