PENERAPAN ALGORITMA K-PROTOTYPES DAN K-MEDOIDS UNTUK PENGELOMPOKAN STATUS RAWAN PANGAN PADA RUMAH TANGGA DI PROVINSI ACEH | ELECTRONIC THESES AND DISSERTATION

Electronic Theses and Dissertation

Universitas Syiah Kuala

    SKRIPSI

PENERAPAN ALGORITMA K-PROTOTYPES DAN K-MEDOIDS UNTUK PENGELOMPOKAN STATUS RAWAN PANGAN PADA RUMAH TANGGA DI PROVINSI ACEH


Pengarang

Salsabila - Personal Name;

Dosen Pembimbing

Muhammad Subianto - 196812111994031005 - Dosen Pembimbing I
Evi Ramadhani - 197309281998022001 - Dosen Pembimbing II



Nomor Pokok Mahasiswa

1908108010040

Fakultas & Prodi

Fakultas MIPA / Statistika (S1) / PDDIKTI : 49201

Penerbit

Banda Aceh : Fakultas MIPA Statistika., 2023

Bahasa

Indonesia

No Classification

519.53

Literature Searching Service

Hard copy atau foto copy dari buku ini dapat diberikan dengan syarat ketentuan berlaku, jika berminat, silahkan hubungi via telegram (Chat Services LSS)

Analisis cluster adalah teknik multivariat yang berkaitan dengan identifikasi kelompok. Tujuan dari analisis cluster adalah untuk mempartisi sekumpulan observasi menjadi sejumlah kelompok atau cluster yang tidak diketahui sedemikian rupa sehingga semua observasi dalam satu cluster memiliki karakteristik yang serupa sementara observasi dalam cluster yang berbeda tidak serupa. K-means merupakan metode dalam analisis cluster yang sangat andal dalam mengelompokan data bertipe numerik, sedangkan k-modes merupakan pengembangan dari metode k-means yang dapat digunakan untuk mengelompokan data bertipe kategorik. Pada kenyataannya, sering kali data bertipe numerik dan kategorik berada dalam satu dataset yang sama sehingga proses pengelompokan juga perlu dilakukan pada kedua tipe data tersebut secara bersama. Data yang digunakan dalam penelitian ini merupakan data rawan pangan yang bersumber dari Survei Sosial Ekonomi Nasional (Susenas). Dalam dataset tersebut terdapat data bertipe numerik dan kategorik, sehingga algoritma pengelompokan yang digunakan pada penelitian ini adalah k-prototypes dan k-medoids yang dapat digunakan pada data bertipe campuran. Penelitian ini bertujuan untuk mendapatkan metode terbaik diantara k-prototypes dan k-medoids dengan membandingkan nilai koefisien silhouette serta mendapatkan karakteristik dari cluster berdasarkan jumlah cluster paling optimum. Berdasarkan hasil penelitian, metode k-prototypes merupakan metode terbaik karena menghasilkan nilai koefisien silhouette tertinggi sebesar 0,2817 dengan jumlah cluster optimum sebanyak 2 cluster. Variabel yang memiliki rata-rata dan modus berbeda dari kedua cluster adalah variabel pendidikan tertinggi KRT, jumlah ART 5 tahun ke atas yang memiliki tabungan, jenis lantai tempat tinggal, jenis dinding tempat tinggal, luas lantai tempat tinggal, dan sumber air minum.

Cluster analysis is a multivariate technique relates to group identification. The aim of cluster analysis is to divide clusters of observation to a group or cluster of unknown group in such a way that all observations in one cluster have similar characteristics while observations in different clusters are dissimilar. K-means is a method in cluster analysis that is very reliable in grouping data of numerical type, while k-modes is an extension of the k-means method which can be used to group data of categorical type. In fact, data of numeric and categorical types are often in the same dataset so that the grouping process also needs to be carried out on both data types together. The data used in this study is food insecurity data sourced from the National Socioeconomic Survey (Susenas). In this dataset contains of numeric and categorical data types, so the clustering algorithm used in this study is k-prototypes and k-medoids which can be used on mixed-type data. This study aims to obtain the best method between k-prototypes and k-medoids by comparing the silhouette coefficient values and obtaining the characteristics of the clusters based on the optimum number of clusters. Based on the result of the research, the k-prototypes method is the best method because it produces the highest silhouette coefficient value that is 0,2817 with an optimum number of clusters that are 2 clusters. Variables that have different averages and modes of the two clusters are the variable the highest education of household head, number of family members 5 years and above who have savings, type of floor residence, type of wall residence, floor area residence, and source of drinking water.

Citation



    SERVICES DESK