PERBANDINGAN PERFORMA KLASIFIKASI STATUS DAERAH KABUPATEN/KOTA TERTINGGAL DI INDONESIA MENGGUNAKAN METODE EXTREME GRADIENT BOOSTING DAN ARTIFICIAL NEURAL NETWORK | ELECTRONIC THESES AND DISSERTATION

Electronic Theses and Dissertation

Universitas Syiah Kuala

    SKRIPSI

PERBANDINGAN PERFORMA KLASIFIKASI STATUS DAERAH KABUPATEN/KOTA TERTINGGAL DI INDONESIA MENGGUNAKAN METODE EXTREME GRADIENT BOOSTING DAN ARTIFICIAL NEURAL NETWORK


Pengarang

SHOFIA TURSINA - Personal Name;

Dosen Pembimbing

Ridha Ferdhiana - 197302141998022001 - Dosen Pembimbing I
Fitriana AR - 197410152006042002 - Dosen Pembimbing II



Nomor Pokok Mahasiswa

2108108010083

Fakultas & Prodi

Fakultas MIPA / Statistika (S1) / PDDIKTI : 49201

Subject
-
Kata Kunci
-
Penerbit

Banda Aceh : Fakultas MIPA (S1)., 2025

Bahasa

No Classification

-

Literature Searching Service

Hard copy atau foto copy dari buku ini dapat diberikan dengan syarat ketentuan berlaku, jika berminat, silahkan hubungi via telegram (Chat Services LSS)

Kesenjangan antar wilayah di Indonesia ditandai dengan adanya pengelompokan daerah menjadi tertinggal dan tidak tertinggal, sebagaimana ditetapkan setiap lima tahun melalui peraturan presiden. Berdasarkan Peraturan Presiden Nomor 63 Tahun 2020 tentang daerah 3T (Tertinggal, Terdepan, dan Terluar), sebanyak 62 kabupaten/kota diklasifikasikan sebagai daerah tertinggal. Penelitian ini menggunakan metode klasifikasi XGBoost dan Artificial Neural Network (ANN) untuk mengidentifikasi status daerah secara otomatis dan akurat. Selain itu, diterapkan metode SHAP (SHapley Additive exPlanations) untuk memahami kontribusi setiap variabel dalam proses klasifikasi. Hasil penelitian menunjukkan bahwa ANN memberikan performa terbaik dengan akurasi 0,9870, mengungguli XGBoost yang memperoleh akurasi 0,9615 setelah tuning hyperparameter menggunakan random search. Klasifikasi akhir menghasilkan akurasi sebesar 0,9786, dengan presisi 0,96, recall 0,94, dan f1-score 0,95. Sebanyak 59 kabupaten/kota diklasifikasikan sebagai daerah tertinggal, sementara 455 sebagai tidak tertinggal. Terdapat 11 kabupaten/kota yang hasil klasifikasinya berbeda dari penetapan resmi, terdiri atas 7 yang sebelumnya tertinggal menjadi tidak tertinggal, dan 4 yang sebelumnya tidak tertinggal diklasifikasikan tertinggal. Variabel dengan kontribusi terbesar terhadap status daerah tertinggal adalah persentase sumber penerangan listrik PLN (Nilai SHAP 0,05), diikuti oleh persentase penduduk miskin (Nilai SHAP 0,04), umur harapan hidup (Nilai SHAP 0,02), rata-rata pengeluaran makanan (Nilai SHAP 0,02), dan indeks keparahan kemiskinan (Nilai SHAP 0,01). Penelitian ini diharapkan dapat menjadi referensi dalam pengambilan kebijakan bagi pemerintah untuk mengurangi kesenjangan antar daerah.

Kata kunci: Klasifikasi, XGBoost, Artificial Neural Network (ANN), SHapley Additive exPlanations (SHAP), daerah tertinggal

The gap between regions in Indonesia is characterized by the classification of regions into underdeveloped and not underdeveloped, as determined every five years through presidential regulations. Based on Presidential Regulation Number 63 of 2020 concerning 3T (Disadvantaged, Frontier, and Outermost) regions, as many as 62 districts/cities are classified as underdeveloped regions. This research uses the XGBoost and Artificial Neural Network (ANN) classification methods to automatically and accurately identify the status of the regions. In addition, the SHAP (SHapley Additive exPlanations) method was applied to understand the contribution of each variable in the classification process. The results showed that the ANN provided the best performance with an accuracy of 0,9870, outperforming XGBoost which obtained an accuracy of 0,9615 after hyperparameter tuning using random search. The final classification resulted in an accuracy of 0,9786, with a precision of 0,96, recall of 0,94, and f1-score of 0,95. A total of 59 districts/municipalities were classified as underdeveloped, while 455 as not underdeveloped. There were 11 districts/municipalities whose classification results differed from the official determination, consisting of 7 that were previously lagging behind becoming not lagging behind, and 4 that were previously not lagging behind being classified as lagging. The variable with the largest contribution to the status of lagging regions is the percentage of PLN electricity sources (SHAP values 0,05), followed by the percentage of poor people (SHAP values 0,04), life expectancy (SHAP values 0,02), average food expenditure (SHAP values 0,02), and poverty severity index (SHAP values 0,01). This research is expected to be a reference in policy making for the government to reduce disparities between regions. Keywords: Classification, XGBoost, Artificial Neural Network (ANN), SHapley Additive exPlanations (SHAP), underdeveloped regions

Citation



    SERVICES DESK