Electronic Theses and Dissertation
Universitas Syiah Kuala
SKRIPSI
PERBANDINGAN KINERJA K-MODES DAN K-MEDOIDS CLUSTERING PADA DATA STATUS KESEJAHTERAAN RUMAH TANGGA BERTIPE KATEGORI ORDINAL (STUDI KASUS: 9 KABUPATEN PROVINSI ACEH)
Pengarang
Nanda Salsabila - Personal Name;
Dosen Pembimbing
Ridha Ferdhiana - 197302141998022001 - Dosen Pembimbing I
Taufik Fuadi Abidin - 197010081994031002 - Dosen Pembimbing II
Nomor Pokok Mahasiswa
2008108010008
Fakultas & Prodi
Fakultas MIPA / Statistika (S1) / PDDIKTI : 49201
Subject
Kata Kunci
Penerbit
Banda Aceh : Fakultas MIPA Statistika., 2024
Bahasa
No Classification
-
Literature Searching Service
Hard copy atau foto copy dari buku ini dapat diberikan dengan syarat ketentuan berlaku, jika berminat, silahkan hubungi via telegram (Chat Services LSS)
Clustering adalah metode analisis yang digunakan untuk mengelompokkan sejumlah data menjadi beberapa klaster berdasarkan kemiripan atau kesamaan karakteristik pada dataset tersebut. K-means clustering merupakan algoritma paling umum yang sangat andal dalam mengelompokkan data bertipe numerik, sedangkan k-modes dan k-medoids merupakan pengembangan dari algoritma k-means yang dapat digunakan untuk mengelompokkan data bertipe kategori. Pada kenyataannya, tidak hanya data bertipe numerik yang berada dalam suatu dataset, namun terdapat juga data kategori yang memerlukan tantangan tersendiri untuk diolah dalam model analisis. Data yang digunakan dalam penelitian ini adalah status kesejahteraan rumah tangga tahun 2019 yang bersumber dari Badan Perencanaan Pembangunan Daerah Aceh. Dataset tersebut bertipe kategori ordinal dengan 34 variabel independen dan 1 variabel dependen yang memiliki akurasi status kesejahteraan rumah tangga yang cukup rendah, sehingga algoritma pengelompokan yang digunakan pada penelitian ini adalah k-modes dan k-medoids clustering. Penelitian ini bertujuan untuk menemukan kategori yang lebih tepat dalam status kesejahteraan rumah tangga pada 9 kabupaten dengan persentase penduduk miskin terendah di Provinsi Aceh serta mendapatkan metode terbaik antara 2 algoritma tersebut. Penelitian ini diharapkan dapat memberikan kontribusi kepada pemerintah dalam membuat kebijakan yang lebih tepat untuk meningkatkan kesejahteraan rumah tangga di Provinsi Aceh. Jarak yang digunakan yaitu jarak hamming pada k-modes dan jarak manhattan pada k-medoids. Hasil analisis menunjukkan bahwa dari 315.255 rumah tangga, sekitar 240.000 rumah tangga berada pada kategori yang berbeda. Hasil pengujian performa menggunakan model decision tree menunjukkan bahwa algoritma k-medoids lebih baik dalam melakukan pengelompokan dengan nilai akurasi, precision, recall dan f1-score sebesar 0,993 yang bermakna kinerja algoritma k-medoids sangat bagus.
Clustering is an analysis method used to group a set of data into several clusters based on similarity or shared characteristics within the dataset. K-means clustering is the most common algorithm that is very reliable for grouping numerical data, while k-modes and k-medoids are developments of the k-means algorithm that can be used to cluster categorical data. In reality, a dataset often contains not only numerical data, but there is also categorical data which presents its own challenges for processing in an analytical model. The data used in this study is the household welfare status for the year 2019, sourced from the Badan Perencanaan Pembangunan Daerah Aceh (Aceh Regional Development Planning Agency). The dataset is an ordinal categorical type with 34 independent variables and 1 dependent variable that has a fairly low accuracy for household welfare status, so the clustering algorithms used in this study are k-modes and k-medoids clustering. This study aims to find more precise categories in the household welfare status in 9 districts with the lowest percentage of poor populations in Aceh Province and to determine the best method between these two algorithms. This research is expected to contribute to the government in making more accurate policies to improve household welfare in Aceh Province. The distances used are Hamming distance in k-modes and Manhattan distance in k-medoids. The analysis results show that out of 315.255 households, around 240.000 households fall into different categories. Performance testing results using the decision tree model indicate that the k-medoids algorithm performs better in clustering with accuracy, precision, recall, and f1-score values of 0.993, signifying the k-medoids algorithm's excellent performance.
DETEKSI OUTLIER DATA KESEJAHTERAAN RUMAH TANGGA PADA KOTA DI ACEH MENGGUNAKAN CLUSTERING BERBASIS K-MODES DAN K-MEDOIDS (Al Haridt Mahmudi, 2024)
PENGGUNAAN KLASIFIKASI NAÏVE BAYES DAN DECISION TREE DALAM MENGIDENTIFIKASI VARIABEL-VARIABEL PENENTU STATUS KESEJAHTERAAN RUMAH TANGGA (STUDI KASUS: 9 KABUPATEN DENGAN PERSENTASE KEMISKINAN TERTINGGI DI ACEH) (PUTRI NADHIFA, 2024)
PERBANDINGAN K-MODES CLUSTERING DAN ROCK CLUSTERING TERHADAP INDIKATOR KEMISKINAN DI KECAMATAN SAMADUA KABUPATEN ACEH SELATAN (Muhammad Iqbal, 2019)
IDENTIFIKASI FITUR-FITUR PENENTUAN STATUS KESEJAHTERAAN RUMAH TANGGA MENGGUNAKAN KLASIFIKASI DECISION TREE DAN NAÏVE BAYES (STUDI KASUS: 9 KABUPATEN PROVINSI ACEH) (Devira Marshanda, 2024)
IDENTIFIKASI FAKTOR-FAKTOR YANG BERPENGARUH DALAM PENENTUAN STATUS KESEJAHTERAAN RUMAH TANGGA MENGGUNAKAN KLASIFIKASI NAÏVE BAYES DAN DECISION TREE PADA KOTA DI PROVINSI ACEH (Nurfazilah, 2024)