Meningkatnya data yang dihasilkan pada zaman big data telah membawa tantangan baru sekaligus peluang dalam pengembangan dan penerapan teknologi machine learning. jenis machine learning yang dapat digunakan adalah klasifikasi dengan metode random forest. random forest merupakan ensemble dari decision tree yang menggunakan teknik bagging (bootstrap aggregating) dalam pembuatan pohon klasifikasi. namun, metode klasifikasi machine learning memiliki kompleksitas model pembelajaran yang sering kali membuatnya sulit untuk dijelaskan dalam bentuk sederhana atau disebut sebagai model black box, sehingga diperlukan metode seperti shapley additive explanations (shap) yang dapat menginterpretasikan model black box menjadi lebih mudah dipahami. data yang digunakan pada penelitian ini adalah data survei sosial ekonomi nasional (susenas) provinsi aceh tahun 2022. penelitian ini bertujuan untuk memperoleh model klasifikasi terbaik dan mengidentifikasi lima variabel dengan tingkat kepentingan tertinggi terhadap rumah tangga rawan pangan. hasil dari penelitian ini menunjukkan bahwa model klasifikasi terbaik adalah model dengan partisi data sebesar 55:45 dan menggunakan hyperparameter optimum yaitu n estimators sebesar 88, max features sebesar 47, max depth sebesar 37, min samples split sebesar 5, min samples leaf sebesar 1, dan criterion dengan entropy. model ini memberikan nilai accuracy sebesar 65,95%, precision sebesar 70,58%, recall sebesar 65,95%, dan f1-score sebesar 67,90%. sementara itu, lima variabel yang memberikan tingkat kepentingan tertinggi yaitu variabel luas lantai tempat tinggal (x29), kelayakan fasilitas sanitasi (x34), pendidikan krt (x1), kepemilikan aset tanah (x7), dan akses internet (x12). hal ini dapat diartikan bahwa kelima variabel tersebut merupakan variabel yang sangat berkontribusi terhadap rumah tangga rawan pangan di provinsi aceh tahun 2022.
Electronic Theses and Dissertation
Universitas Syiah Kuala
SKRIPSI
IMPLEMENTASI SHAP PADA KLASIFIKASI RANDOM FOREST UNTUK IDENTIFIKASI TINGKAT KEPENTINGAN VARIABEL KARAKTERISTIK RUMAH TANGGA RAWAN PANGAN DI PROVINSI ACEH. Banda Aceh Fakultas MIPA Statistika,2024
Baca Juga : PENERAPAN SMOTE CART DALAM MENGIDENTIFIKASI KARAKTERISTIK RUMAH TANGGA RAWAN PANGAN DI PROVINSI ACEH (Shafira Mustaqima, 2022)
Abstract
The increase in data generated during the era of big data has brought new challenges as well as opportunities in the development and application of machine learning technologies. One type of machine learning that can be used is classification using the Random Forest method. Random Forest is an ensemble of Decision Trees that uses the bagging (bootstrap aggregating) technique in the creation of classification trees. However, the complexity of machine learning classification models often makes them difficult to explain in simple terms, resulting in what is often referred to as black box models. Therefore, methods such as SHapley Additive exPlanations (SHAP) are required to interpret black box models and make them more understandable. The data used in this study is from the 2022 National Socio-Economic Survey (Susenas) of Aceh Province. The study aims to obtain the best classification model and identify the five variables with the highest importance to food-insecure households. The results of this study show that the best classification model uses a data partition of 55:45 and optimal hyperparameters: n estimators of 88, max features of 47, max depth of 37, min samples split of 5, min samples leaf of 1, and criterion using entropy. This model provides an accuracy of 65.95%, a precision of 70,58%, a recall of 65,95%, and an F1-score of 67,90%. Meanwhile, the five variables that provide the highest importance are the variables of floor area of the residence (X29), adequacy of sanitation facilities (X34), head of household education (X1), land asset ownership (X7), and internet access (X12). This indicates that these five variables significantly contribute to the food insecurity of households in Aceh Province in 2022.
Baca Juga : PENERAPAN KLASIFIKASI RANDOM FOREST DALAM PENENTUAN FAKTOR-FAKTOR YANG MEMENGARUHI STATUS KESEJAHTERAAN RUMAH TANGGA (STUDI KASUS: 8 KABUPATEN PROVINSI ACEH) (GILANG AWAL RAMADHAN, 2025)