Universitas Syiah Kuala | ELECTRONIC THESES AND DISSERTATION

Electronic Theses and Dissertation

Universitas Syiah Kuala

    SKRIPSI
Teuku Tamam Al Fatah, PENGEMBANGAN SISTEM CERDAS ANALISIS SENTIMEN ARTIKEL BERITA DAN MEDIA SOSIAL X MENGGUNAKAN ALGORITMA INDOBERT DAN ROBERTA. Banda Aceh Fakultas MIPA Informatika,2025

Analisis sentimen merupakan metode yang digunakan untuk mengelompokkan dan memahami opini publik yang tercermin dalam teks. penelitian ini bertujuan untuk mengembangkan sistem cerdas analisis sentimen terhadap artikel berita dan unggahan media sosial x dengan menggunakan algoritma indobert dan roberta. sistem dirancang fleksibel yang memungkinkan pengguna melakukan analisis sentimen sesuai kebutuhan spesifik pengguna. data dikumpulkan dari situs berita kompas, detik, dan media sosial x, kemudian diringkas dan dilabel otomatis menggunakan model llm seperti gpt, gemma, dan llama. model dilatih menggunakan dataset berbahasa indonesia sebanyak 7.676 sampel yang diklasifikasikan ke dalam tiga kelas sentimen, yaitu positif, netral, dan negatif. proses pelatihan dan evaluasi dilakukan dengan pendekatan fine-tuning, menggunakan metrik akurasi dan macro f1-score sebagai alat ukur performa. hasil penelitian menunjukkan bahwa model roberta memiliki performa lebih unggul dibandingkan indobert, dengan akurasi dan macro f1-score masing-masing mencapai 96%. sistem cerdas analisis sentimen diimplementasikan ke dalam website menggunakan kerangka kerja fastapi, website sistem cerdas analisis sentimen memiliki fitur inferensi, crawling, summarizing, dan labeling, serta fine-tuning yang memungkinkan pengguna melatih ulang model. penelitian ini membuktikan bahwa integrasi model transformer dan sistem cerdas dapat meningkatkan efektivitas analisis sentimen terhadap opini publik dalam bahasa indonesia. kata kunci: analisis sentimen, indobert, roberta, media sosial, artikel berita, transformer.



Abstract

Sentiment analysis is a method used to group and understand public opinion reflected in text. This study aims to develop an intelligent sentiment analysis system for news articles and social media posts using the IndoBERT and RoBERTa algorithms. The system is designed to be flexible, allowing users to perform sentiment analysis according to their specific needs. Data were collected from news sites Kompas and Detik, as well as social media platform X, and then summarized and automatically labeled using LLM models such as GPT, Gemma, and Llama. The model was trained using an Indonesian language dataset comprising 7,676 samples, classified into three sentiment classes: positive, neutral, and negative. The training and evaluation process was carried out using a fine-tuning approach, using accuracy metrics and Macro F1-score as performance measures. The results showed that the RoBERTa model outperformed IndoBERT, with accuracy and Macro F1-score reaching 96% each. The intelligent sentiment analysis system was implemented into a website using the FastAPI framework. The sentiment analysis system features inference, crawling, summary, and labeling capabilities, as well as fine-tuning, allowing users to retrain the model. This study demonstrates that integrating transformer models and intelligent systems can enhance the effectiveness of sentiment analysis on public opinion in Indonesia. Keywords: Sentiment Analysis, IndoBERT, RoBERTa, Social Media, News Articles, Transformer.



    SERVICES DESK