PENGGUNAAN KLASIFIKASI NAÏVE BAYES DAN DECISION TREE DALAM MENGIDENTIFIKASI VARIABEL-VARIABEL PENENTU STATUS KESEJAHTERAAN RUMAH TANGGA (STUDI KASUS: 9 KABUPATEN DENGAN PERSENTASE KEMISKINAN TERTINGGI DI ACEH) | ELECTRONIC THESES AND DISSERTATION

Electronic Theses and Dissertation

Universitas Syiah Kuala

    SKRIPSI

PENGGUNAAN KLASIFIKASI NAÏVE BAYES DAN DECISION TREE DALAM MENGIDENTIFIKASI VARIABEL-VARIABEL PENENTU STATUS KESEJAHTERAAN RUMAH TANGGA (STUDI KASUS: 9 KABUPATEN DENGAN PERSENTASE KEMISKINAN TERTINGGI DI ACEH)


Pengarang

PUTRI NADHIFA - Personal Name;

Dosen Pembimbing

Ridha Ferdhiana - 197302141998022001 - Dosen Pembimbing I
Fitriana AR - 197410152006042002 - Dosen Pembimbing II



Nomor Pokok Mahasiswa

2008108010025

Fakultas & Prodi

Fakultas MIPA / Statistika (S1) / PDDIKTI : 49201

Subject
-
Kata Kunci
-
Penerbit

Banda Aceh : Fakultas MIPA Statistika., 2024

Bahasa

No Classification

-

Literature Searching Service

Hard copy atau foto copy dari buku ini dapat diberikan dengan syarat ketentuan berlaku, jika berminat, silahkan hubungi via telegram (Chat Services LSS)

Status kesejahteraan mencerminkan keberhasilan pemerintah dalam meningkatkan kesejahteraan masyarakat dan menjadi indikator yang akurat untuk mengidentifikasi kelompok yang membutuhkan bantuan seperti kelompok masyarakat miskin. Terdapat 9 Kabupaten di Provinsi Aceh yang masih memiliki tingkat kemiskinan yang tinggi. Salah satu faktor yang dapat menghambat penurunan tingkat kemiskinan ini adalah kategori status kesejahteraan yang seringkali tidak sesuai dengan kondisi rumah tangga yang sebenarnya sehingga menghambat efektivitas program pengentasan kemiskinan. Data status kesejahteraan merupakan data yang besar sehingga membutuhkan peran data mining untuk mengklasifikasi status kesejahteraan seperti metode Naïve Bayes dan Decision Tree. Kedua metode tersebut merupakan metode klasifikasi yang cocok digunakan untuk data bertipe kategori seperti status kesejahteraan rumah tangga. Penelitian ini bertujuan untuk membandingkan tingkat performa hasil klasifikasi antara metode Naïve Bayes dan Decision Tree berbasis seleksi variabel Information Gain pada data status kesejahteraan rumah tangga di 9 kabupaten dengan persentase kemiskinan tertinggi di Aceh. Data yang digunakan dalam penelitian ini adalah Data Terpadu Kesejahteraan Sosial (DTKS) tahun 2019. Data status kesejahteraan ini dilakukan proses clustering K-modes sebagai perbandingan ketepatan pengelompokan status kesejahteraan rumah tangga yang telah ditentukan. Hasil penelitian ini menunjukkan bahwa data hasil cluster lebih baik mengklasifikasi kesejahteraan rumah tangga dan metode klasifikasi terbaik yaitu metode Decision Tree dengan nilai performa yaitu nilai Accuracy 99,03%, Precision 98,94%, Recall 98,92%, dan F1-score 98,93%. Variabel yang paling berkontribusi dalam penentuan status kesejahteraan rumah tangga yaitu jumlah anggota keluarga (X1), sumber air minum (X10), bahan bakar untuk memasak (X14), jenis kloset (X16), penggunaan fasilitas BAB (X15), tempat pembuangan akhir tinja (X17) dan kepemilikan lemari es/kulkas (X19).

The welfare status reflects the government's success in improving community welfare and serves as an accurate indicator for identifying groups in need of assistance, such as the poor. In Aceh Province, there are 9 districts that still have high poverty rates. One of the factors that can hinder the reduction of the poverty rate is the welfare status category, which often does not match the actual conditions of households, thus hampering the effectiveness of poverty alleviation programs. Welfare status data comprises a large dataset that necessitates the application of data mining techniques to classify welfare statuses, such as the Naïve Bayes and Decision Tree methods. Both methods are suitable for classifying categorical data like household welfare statuses. This study aims to compare the performance levels of classification results between the Naïve Bayes and Decision Tree methods based on the selection of information gain variables regarding household welfare status data in the 9 districts with the highest percentage of poverty in Aceh. The data utilized in this research is the 2019 Integrated Social Welfare Data (DTKS). This welfare status data undergoes the K-modes clustering process for comparison with the accuracy of the clustered household welfare statuses that have been determined. The results of this study indicate that the clustered data better classifies household welfare statuses, with the Decision Tree method exhibiting the best classification method performance, boasting an Accuracy value of 99.03%, Precision of 98.94%, Recall of 98.92%, and an F1-score of 98.93%. The variables most contributing to determining household welfare statuses are the number of family members (X1), drinking water source (X10), cooking fuel (X14), type of toilet (X16), use of defecation facilities (X15), final disposal of feces (X17), and ownership of a refrigerator (X19).

Citation



    SERVICES DESK