Universitas Syiah Kuala | ELECTRONIC THESES AND DISSERTATION

Electronic Theses and Dissertation

Universitas Syiah Kuala

    SKRIPSI
Karina Afifah, ANALISIS PERFORMA METODE GRADIENT BOOSTING REGRESSION DALAM PREDIKSI DAN IDENTIFIKASI FAKTOR DOMINAN TINGKAT PENGANGGURAN TERBUKA DI  INDONESIA. Banda Aceh Fakultas MIPA Statistika,2025

Tingkat pengangguran terbuka (tpt) masih menjadi tantangan utama pembangunan di indonesia meskipun pertumbuhan ekonomi menunjukkan tren positif. variasi tpt antarprovinsi dipengaruhi oleh faktor ekonomi, sosial, pendidikan, dan ketenagakerjaan. penelitian ini bertujuan untuk mengevaluasi performa metode gradient boosting regression (gbr) dalam memprediksi tpt serta mengidentifikasi faktor-faktor dominan yang memengaruhinya. data penelitian mencakup seluruh provinsi di indonesia selama periode 2015–2024 dengan 13 variabel independen. proses analisis meliputi preprocessing data, pembagian data latih dan uji dengan beberapa rasio, dan penyusunan model baseline. kemudian dilakukan hyperparameter tuning menggunakan grid search, random search, dan optuna search, serta analisis feature importance untuk mengidentifikasi faktor dominan yang memengaruhi tpt. hasil penelitian menunjukkan bahwa optuna search menghasilkan kombinasi hyperparameter optimal dengan nilai mape 10,60%, yang lebih baik dibandingkan metode tuning lainnya. evaluasi performa model menunjukkan adanya peningkatan akurasi prediksi setelah proses tuning, khusus pada partisi data 70:30 di mana nilai mape turun sebesar 6,39% dan r² meningkat menjadi 85%. analisis feature importance mengungkapkan bahwa faktor paling dominan yang memengaruhi tpt adalah tingkat partisipasi angkatan kerja (x11). hasil ini menunjukkan bahwa indikator ketenagakerjaan berperan penting dalam menentukan variasi tpt.



Abstract

Open Unemployment Rate (TPT) remains a major challenge for development in Indonesia despite the positive trend in economic growth. Variations in TPT across provinces are influenced by economic, social, educational, and labor-related factors. This study aims to evaluate the performance of the Gradient Boosting Regression (GBR) method in predicting TPT and to identify the dominant factors affecting it. The research data covers all provinces in Indonesia during the 2015–2024 period with 13 independent variables. The analysis process includes data preprocessing, splitting data into training and testing sets with several ratios, and constructing a baseline model. Hyperparameter tuning was then conducted using Grid Search, Random Search, and Optuna Search, along with feature importance analysis to identify the dominant factors influencing TPT. The results show that Optuna Search produced the optimal hyperparameter configuration with an MAPE value of 10,60%, outperforming other tuning methods. Model performance evaluation indicates an improvement in prediction accuracy after tuning, with a significant enhancement in the 70:30 data partition where the MAPE decreased by 6,39% and R² increased to 85%. The feature importance analysis revealed that the most dominant factor affecting TPT is the Labor Force Participation Rate (X11). These findings suggest that labor market indicators play a crucial role in determining variations in TPT.



    SERVICES DESK