Tiktok merupakan salah satu platform media sosial yang sangat populer di indonesia dan banyak digunakan untuk promosi produk, termasuk produk skincare seperti sunscreen. banyaknya komentar pengguna pada video tiktok menjadi sumber data yang potensial untuk dianalisis guna memahami sentimen publik terhadap suatu merek. penelitian ini bertujuan untuk mengembangkan sistem klasifikasi otomatis yang mampu mengelompokkan komentar tiktok ke dalam tiga kategori sentimen, yaitu positif, netral, dan negatif. data komentar dikumpulkan melalui proses web scraping dari enam brand sunscreen populer, yakni wardah, azarine, skintific, the originote, madame gie, dan facetology. total data yang digunakan berjumlah 13.913 komentar, yang telah melalui proses pra-pemrosesan dan augmentasi data menggunakan teknik backtranslation untuk menangani ketidakseimbangan kelas. pelabelan komentar dilakukan secara otomatis menggunakan model generative ai (gpt-4o mini) yang kemudian divalidasi secara manual. teks komentar dikonversi menjadi vektor numerik menggunakan metode tf-idf sebelum digunakan untuk pelatihan tiga algoritma klasifikasi, yaitu support vector machine (svm), naive bayes (multinomialnb), dan random forest. proses tuning hyperparameter dilakukan dengan gridsearchcv untuk mendapatkan performa optimal. hasil evaluasi menunjukkan bahwa model svm dan random forest memiliki performa terbaik dengan akurasi masing-masing 80,78% dan 80,74%, serta f1-score sebesar 0.8062 dan 0.8061. sementara itu, model naive bayes menunjukkan hasil f1-score sebesar 0.6378. hasil klasifikasi ditampilkan dalam bentuk visualisasi interaktif berbasis streamlit, seperti pie chart dan word cloud berdasarkan masing-masing sentimen. penelitian ini menunjukkan bahwa kombinasi teknik preprocessing, augmentasi data, dan tuning hyperparameter dapat meningkatkan efektivitas model klasifikasi dalam menganalisis sentimen komentar tiktok. sistem yang dikembangkan berpotensi menjadi alat bantu bagi pelaku industri maupun peneliti untuk memahami persepsi konsumen terhadap suatu produk secara efisien. kata kunci : tiktok, sentimen, web scraping, tf-idf, svm, naive bayes, random forest, augmentasi
Electronic Theses and Dissertation
Universitas Syiah Kuala
SKRIPSI
ANALISIS SENTIMEN PENGGUNA APLIKASI TIKTOK TERHADAP PRODUK SUNSCREEN ATAU TABIR SURYA MENGGUNAKAN ALGORITMA SUPPORT VECTOR MACHINE, NAIVE BAYES CLASSIFIER DAN RANDOM FOREST. Banda Aceh Fakultas mipa,2025
Baca Juga : DETEKSI KOMENTAR SPAM PADA YOUTUBE MENGGUNAKAN ENSEMBLE MACHINE LEARNING (Ahmad Faqih Al Ghiffary, 2025)
Abstract
TikTok is one of the most popular social media platforms in Indonesia and is widely used for product promotion, including skincare products such as sunscreen. The large volume of user comments on TikTok videos serves as a valuable data source for analyzing public sentiment toward a particular brand. This study aims to develop an automatic classification system capable of categorizing TikTok comments into three sentiment classes: positive, neutral, and negative. Comment data was collected through a web scraping process from six popular sunscreen brands: Wardah, Azarine, Skintific, The Originote, Madame Gie, and Facetology. A total of 13,913 comments were used, which underwent preprocessing and data augmentation using the backtranslation technique to address class imbalance. The labeling process was conducted automatically using a Generative AI model (GPT-4o mini), and manually validated to ensure label accuracy. The text comments were transformed into numerical vectors using the TF-IDF method before being used to train three classification algorithms: Support Vector Machine (SVM), Naive Bayes (MultinomialNB), and Random Forest. Hyperparameter tuning was performed using GridSearchCV to achieve optimal model performance. Evaluation results showed that the SVM and Random Forest models achieved the best performance with accuracy scores of 80.78% and 80.74%, and F1-scores of 0.8062 and 0.8061, respectively. Meanwhile, the Naive Bayes model yielded an F1-score of 0.6378. The classification results were visualized interactively using a Streamlit-based application, including pie charts and word clouds for each sentiment category. This study demonstrates that the combination of preprocessing techniques, data augmentation, and hyperparameter tuning can significantly improve the performance of sentiment classification models in analyzing TikTok comments. The developed system has the potential to be a useful tool for industry practitioners and researchers in understanding consumer perceptions of a product efficiently. Keywords : TikTok, Sentiment, Web Scraping, TF-IDF, SVM, Naive Bayes, Random Forest, Augmentation