Universitas Syiah Kuala | ELECTRONIC THESES AND DISSERTATION

Electronic Theses and Dissertation

Universitas Syiah Kuala

    SKRIPSI
ULFA SAFIRA ADRIANI, ANALISIS SENTIMEN PENGGUNA TERHADAP BEBERAPA APLIKASI MILIK BUMN. Banda Aceh Fakultas Teknik Komputer,2025

Analisis sentimen digunakan untuk dapat memberikan wawasan kepada pemberi layanan agar dapat meningkatkan kualitas layanan yang diberikan. ulasan-ulasan pengguna terkait kepuasan mereka terhadap suatu layanan diperoleh pada platform google play store. penelitian ini melakukan analisis sentimen menggunakan tiga algoritma machine learning, yaitu random forest, decision tree, logistic regression terhadap 5 aplikasi bumn pada tahun 2025. ulasan pengguna akan dikelompokkan ke dalam sentimen positif, negatif dan netral. algoritma random forest menunjukkan nilai akurasi yang tinggi pada data pelatihan, meskipun pada beberapa objek cenderung overfitting. dan decision tree menunjukkan overfitting yang lebih parah dibanding random forest. sementara itu, logistic regression menghasilkan performa paling stabil yang memiliki selisih yang kecil antara data pelatihan dan testing, menjadikan algoritma yang lebih baik untuk generalisasi prediksi sentimen pada data baru. hasil analisis, logistic regression direkomendasikan untuk analisis sentimen pada dataset ini, sedangkan random forest dapat digunakan jika memerlukan nilai akurasi yang tinggi untuk data pelatihan.



Abstract

Sentiment analysis is utilized to provide insights for service providers to improve the quality of services offered. User reviews regarding their satisfaction with a given service were collected from the Google Play Store platform. These user reviews were classified into three sentiment categories: positive, negative, and neutral. This study conducts sentiment analysis using three machine learning algorithms—Random Forest, Decision Tree, and Logistic Regression—on reviews from five state-owned enter prise (BUMN) applications in 2025. The results indicate that the Random Forest algorithm achieves high accuracy on the pelatihan data, although it tends to overfit in several cases. The Decision Tree algorithm exhibits even more pronounced overfitting compared to RandomForest. In contrast, Logistic Regression demonstrates the most stable performance, with a minimal gap between pelatihan and pengujianaccuracy, making it more suitable for generalizing sentiment predictions on unseen data. Based on the analysis, Logistic Regression is recommended for sentiment classification on this dataset, while Random Forest may be preferred in scenarios that prioritize high pelatihan accuracy.



    SERVICES DESK