PERBANDINGAN KINERJA ALGORITMA MACHINE LEARNING DALAM MENDETEKSI STUNTING DENGAN PENERAPAN METODE RECURSIVE FEATURE ELIMINATION DAN SMOTE | ELECTRONIC THESES AND DISSERTATION

Electronic Theses and Dissertation

Universitas Syiah Kuala

    THESES

PERBANDINGAN KINERJA ALGORITMA MACHINE LEARNING DALAM MENDETEKSI STUNTING DENGAN PENERAPAN METODE RECURSIVE FEATURE ELIMINATION DAN SMOTE


Pengarang

Reza Aulia - Personal Name;

Dosen Pembimbing

Hizir - 196805311993031003 - Dosen Pembimbing I
Asep Rusyana - 197603172006041001 - Dosen Pembimbing II



Nomor Pokok Mahasiswa

2108207010004

Fakultas & Prodi

Fakultas MIPA / Magister Kecerdasan Buatan (S2) / PDDIKTI : 49302

Subject
-
Kata Kunci
-
Penerbit

Banda Aceh : Fakultas MIPA (S2)., 2025

Bahasa

No Classification

-

Literature Searching Service

Hard copy atau foto copy dari buku ini dapat diberikan dengan syarat ketentuan berlaku, jika berminat, silahkan hubungi via telegram (Chat Services LSS)

Stunting merupakan permasalahan kesehatan seluruh dunia yang berdampak signifikan terhadap pertumbuhan dan perkembangan anak. Prevalensi stunting di Indonesia masih tinggi, termasuk di Provinsi Aceh yang mencapai 31,2%, jauh di atas rata-rata nasional sebesar 21,6%. Kondisi ini menuntut pendekatan berbasis data untuk mendukung deteksi dini dan intervensi yang lebih efektif. Penelitian ini bertujuan untuk membandingkan kinerja berbagai algoritma machine learning dalam memprediksi status gizi anak, mengidentifikasi fitur yang paling berpengaruh terhadap status gizi, serta mengembangkan model prediksi yang akurat dan dapat diandalkan. Data yang digunakan adalah dataset Survei Status Gizi Indonesia (SSGI) Provinsi Aceh 2022. Penelitian ini menggunakan lima algoritma machine learning, yaitu Decision Tree, Random Forest, XGBoost, Support Vector Machine (SVM), dan Logistic Regression. Data preprocessing dilakukan dengan simple imputation untuk mengisi nilai yang hilang, serta nominal encoding untuk transformasi fitur kategorikal. Teknik seleksi fitur Recursive Feature Elimination (RFE) dan balancing data Synthetic Minority Oversampling Technique (SMOTE) diterapkan untuk meningkatkan kualitas model dan menangani ketidakseimbangan data. Hasil penelitian menunjukkan bahwa model dengan kombinasi RFE dan SMOTE memberikan performa terbaik dalam meningkatkan recall dan AUC-ROC. Pengujian dilakukan terhadap 5 model. Model terbaik yang diperoleh adalah SVM dengan recall tertinggi sebesar 96,75%, serta AUC-ROC sebesar 92,34%. Identifikasi fitur menggunakan model SVM dan kombinasi RFE dan SMOTE diperoleh sebanyak 2 fitur utama yaitu Panjang_Tinggi_Badan dan Umur_Balita sebagai faktor paling berpengaruh, dengan masing-masing fitur memiliki nilai 0,436 dan 0,370 sebagai faktor yang memberikan kontribusi terbesar dalam meningkatkan performa model prediksi. Model prediksi yang dikembangkan dapat menjadi alat bantu yang efektif untuk mendukung deteksi dini stunting di Provinsi Aceh, sehingga dapat mendukung upaya intervensi gizi yang lebih tepat sasaran.

Kata Kunci: machine learning, recursive feature elimination, prediksi status gizi, smote, stunting

Stunting remains a major global health issue that significantly impacts child growth and development. In Indonesia, the prevalence of stunting is still high, with Aceh Province reporting a rate of 31.2%, which is considerably above the national average of 21.6%. This condition necessitates a data-driven approach to support early detection and more effective nutritional interventions. This study aims to compare the performance of several machine learning algorithms in predicting children's nutritional status, identify the most influential features affecting nutritional outcomes, and develop an accurate and reliable predictive model. The dataset used is derived from the 2022 Indonesian Nutritional Status Survey (SSGI) for Aceh Province. Five machine learning algorithms were employed: Decision Tree, Random Forest, XGBoost, Support Vector Machine (SVM), and Logistic Regression. Data preprocessing involved simple imputation to handle missing values and nominal encoding for categorical variables. Furthermore, Recursive Feature Elimination (RFE) was applied for feature selection, and the Synthetic Minority Oversampling Technique (SMOTE) was utilized to address class imbalance. The experimental results indicate that models combining RFE and SMOTE significantly enhance recall and AUC-ROC performance. Among the evaluated models, the SVM model achieved the best performance with a recall of 96.75% and an AUC-ROC of 92.34%. Feature importance analysis using the SVM model with RFE and SMOTE identified Height/Length and Child Age as the two most influential features, with contribution scores of 0.436 and 0.370, respectively. The proposed predictive model demonstrates strong potential as a decision-support tool for early stunting detection in Aceh Province and can facilitate more targeted nutritional interventions. Key words: stunting, machine learning, recursive feature elimination, SMOTE, nutritional status prediction

Citation



    SERVICES DESK