PERBANDINGAN KINERJA K-MODES DAN K-MEDOIDS CLUSTERING PADA DATA STATUS KESEJAHTERAAN RUMAH TANGGA BERTIPE KATEGORI ORDINAL (STUDI KASUS: 9 KABUPATEN PROVINSI ACEH) | ELECTRONIC THESES AND DISSERTATION

Electronic Theses and Dissertation

Universitas Syiah Kuala

    SKRIPSI

PERBANDINGAN KINERJA K-MODES DAN K-MEDOIDS CLUSTERING PADA DATA STATUS KESEJAHTERAAN RUMAH TANGGA BERTIPE KATEGORI ORDINAL (STUDI KASUS: 9 KABUPATEN PROVINSI ACEH)


Pengarang

Nanda Salsabila - Personal Name;

Dosen Pembimbing

Ridha Ferdhiana - 197302141998022001 - Dosen Pembimbing I
Taufik Fuadi Abidin - 197010081994031002 - Dosen Pembimbing II



Nomor Pokok Mahasiswa

2008108010008

Fakultas & Prodi

Fakultas MIPA / Statistika (S1) / PDDIKTI : 49201

Subject
-
Kata Kunci
-
Penerbit

Banda Aceh : Fakultas MIPA Statistika., 2024

Bahasa

No Classification

-

Literature Searching Service

Hard copy atau foto copy dari buku ini dapat diberikan dengan syarat ketentuan berlaku, jika berminat, silahkan hubungi via telegram (Chat Services LSS)

Clustering adalah metode analisis yang digunakan untuk mengelompokkan sejumlah data menjadi beberapa klaster berdasarkan kemiripan atau kesamaan karakteristik pada dataset tersebut. K-means clustering merupakan algoritma paling umum yang sangat andal dalam mengelompokkan data bertipe numerik, sedangkan k-modes dan k-medoids merupakan pengembangan dari algoritma k-means yang dapat digunakan untuk mengelompokkan data bertipe kategori. Pada kenyataannya, tidak hanya data bertipe numerik yang berada dalam suatu dataset, namun terdapat juga data kategori yang memerlukan tantangan tersendiri untuk diolah dalam model analisis. Data yang digunakan dalam penelitian ini adalah status kesejahteraan rumah tangga tahun 2019 yang bersumber dari Badan Perencanaan Pembangunan Daerah Aceh. Dataset tersebut bertipe kategori ordinal dengan 34 variabel independen dan 1 variabel dependen yang memiliki akurasi status kesejahteraan rumah tangga yang cukup rendah, sehingga algoritma pengelompokan yang digunakan pada penelitian ini adalah k-modes dan k-medoids clustering. Penelitian ini bertujuan untuk menemukan kategori yang lebih tepat dalam status kesejahteraan rumah tangga pada 9 kabupaten dengan persentase penduduk miskin terendah di Provinsi Aceh serta mendapatkan metode terbaik antara 2 algoritma tersebut. Penelitian ini diharapkan dapat memberikan kontribusi kepada pemerintah dalam membuat kebijakan yang lebih tepat untuk meningkatkan kesejahteraan rumah tangga di Provinsi Aceh. Jarak yang digunakan yaitu jarak hamming pada k-modes dan jarak manhattan pada k-medoids. Hasil analisis menunjukkan bahwa dari 315.255 rumah tangga, sekitar 240.000 rumah tangga berada pada kategori yang berbeda. Hasil pengujian performa menggunakan model decision tree menunjukkan bahwa algoritma k-medoids lebih baik dalam melakukan pengelompokan dengan nilai akurasi, precision, recall dan f1-score sebesar 0,993 yang bermakna kinerja algoritma k-medoids sangat bagus.

Clustering is an analysis method used to group a set of data into several clusters based on similarity or shared characteristics within the dataset. K-means clustering is the most common algorithm that is very reliable for grouping numerical data, while k-modes and k-medoids are developments of the k-means algorithm that can be used to cluster categorical data. In reality, a dataset often contains not only numerical data, but there is also categorical data which presents its own challenges for processing in an analytical model. The data used in this study is the household welfare status for the year 2019, sourced from the Badan Perencanaan Pembangunan Daerah Aceh (Aceh Regional Development Planning Agency). The dataset is an ordinal categorical type with 34 independent variables and 1 dependent variable that has a fairly low accuracy for household welfare status, so the clustering algorithms used in this study are k-modes and k-medoids clustering. This study aims to find more precise categories in the household welfare status in 9 districts with the lowest percentage of poor populations in Aceh Province and to determine the best method between these two algorithms. This research is expected to contribute to the government in making more accurate policies to improve household welfare in Aceh Province. The distances used are Hamming distance in k-modes and Manhattan distance in k-medoids. The analysis results show that out of 315.255 households, around 240.000 households fall into different categories. Performance testing results using the decision tree model indicate that the k-medoids algorithm performs better in clustering with accuracy, precision, recall, and f1-score values of 0.993, signifying the k-medoids algorithm's excellent performance.

Citation



    SERVICES DESK