PENERAPAN ANALISIS CLUSTER ENSEMBLE ROCK PADA DATA INDIKATOR KESEJAHTERAAN RAKYAT KABUPATEN/KOTA DI TIGA PROVINSI TERMISKIN PULAU SUMATRA | ELECTRONIC THESES AND DISSERTATION

Electronic Theses and Dissertation

Universitas Syiah Kuala

    SKRIPSI

PENERAPAN ANALISIS CLUSTER ENSEMBLE ROCK PADA DATA INDIKATOR KESEJAHTERAAN RAKYAT KABUPATEN/KOTA DI TIGA PROVINSI TERMISKIN PULAU SUMATRA


Pengarang

Ratil Tartila - Personal Name;

Dosen Pembimbing

Saiful Mahdi - 196805191994031012 - Dosen Pembimbing I
Nurhasanah - 197405192008012007 - Dosen Pembimbing II



Nomor Pokok Mahasiswa

2008108010039

Fakultas & Prodi

Fakultas MIPA / Statistika (S1) / PDDIKTI : 49201

Subject
-
Kata Kunci
-
Penerbit

Banda Aceh : ., 2024

Bahasa

No Classification

-

Literature Searching Service

Hard copy atau foto copy dari buku ini dapat diberikan dengan syarat ketentuan berlaku, jika berminat, silahkan hubungi via telegram (Chat Services LSS)

Analisis cluster merupakan analisis yang digunakan untuk mengelompokkan data berdasarkan karakteristik yang dimiliknya. Pada umumnya metode pengelompokan hanya berfokus pada variabel dengan tipe data numerik atau kategorik. Dalam implementasinya, data bertipe campuran sering ditemukan dan menjadi permasalahan dalam menerapkan analisis cluster. Salah satu metode pengelompokan data campuran yang dapat digunakan adalah metode cluster ensemble ROCK. Cluster ensemble ROCK adalah metode pengelompokan dengan menggabungkan hasil pengelompokan dari beberapa metode kemudian dilakukan pengelompokan kembali menggunakan metode ROCK. Data yang digunakan dalam penelitian ini adalah data indikator kesejahteraan rakyat pada tiga provinsi termiskin di Pulau Sumatra yaitu Provinsi Aceh, Bengkulu, dan Sumatera Selatan sebanyak 50 kabupaten/kota. Indikator kesejahteraan rakyat terdiri dari 13 variabel numerik dan 2 variabel kategorik. Tujuan penelitian ini adalah mendapatkan kelompok terbaik berdasarkan rasio S_W dan S_B, mendapatkan variabel-variabel yang memberikan perbedaan signifikan terhadap hasil pengelompokan, dan mengetahui karakteristik hasil final cluster. Hasil penelitian diperoleh dua cluster terbaik menggunakan jarak Euclidean dengan rasio S_W dan S_B terkecil sebesar 0,0430 pada threshold θ = 0,05. Variabel-variabel yang memberikan perbedaan signifikan terhadap hasil pengelompokan terdiri dari 8 variabel numerik dan 2 variabel kategorik yaitu kepadatan penduduk (X_1), persentase balita yang penolong persalinannya ditolong oleh tenaga medis (X_3), Indeks Pembangunan Manusia (X_5), angka partisipasi sekolah 16-18 tahun (X_6), Tingkat Pengangguran Terbuka (X_7), rata-rata pengeluaran per kapita untuk makanan dan bukan makanan sebulan (X_8), rata-rata konsumsi kalori per kapita sehari (X_9), persentase rumah tangga yang memiliki akses terhadap sumber air utama yang layak (X_11), persentase rumah tangga yang memiliki tangki septik sebagai Tempat Pembuangan Akhir Tinja (TAPT) (X_12), dan persentase kepemilikan rumah (X_13). Adapun karakteristik pada masing-masing cluster berdasarkan perbedaan nilai rata-rata menunjukkan bahwa rata-rata dari lima variabel memiliki nilai lebih tinggi pada cluster 2 yang mengindikasikan tingkat kesejahteraan yang lebih baik daripada cluster 1.
Kata kunci: cluster ensemble ROCK, agglomerative, kesejahteraan rakyat,
karakteristik

Cluster analysis is one of the analysis used to group data based on its characteristics. Generally, grouping methods focus only on variables with numerical or categorical data types. In its implementation, mixed data types are often found and become problematic in applying cluster analysis. One of the methods of grouping mixed data that can be used to solve this problem is the ROCK ensemble cluster method. The ROCK cluster ensemble is a grouping method by combining the grouping results form several methods and then grouping them using the ROCK method. The data used in this study are data indicators of people’s well-being in the three poorest provinces on the island of Sumatra namely the provinces of Aceh, Bengkulu, and South Sumatera of 50 district/cities. The objective of this study is to obtain the best group based on the ratio S_W and S_B, obtain variables that give significant differences to the grouping results, and know the characteristics of the final result of the cluster. The result of the study obtains the two best clustering using Euclidean spacing with the smallest ratio S_W and S_B of 0,0430 at threshold θ = 0,05. The variables give a significant difference to the grouping results consist 0f eight numeric variables and two categorical variables namely population density (X_1), percentage of young people whose maternity assistants are assisted by medical personnel (X_3), human development index (X_5), school attendance rate 16-18 years old (X_6), open unemployment rate (X_7), average per capita spending on food and non-food per month (X_8), average calorie consumption per capita per day (X_9), proportion of households having access to adequate primary water resources (X_11), percentages of families having septic tanks as final sewage disposal sites (X_12), and percents of home ownership (X_13). As for, the characteristics of each cluster based on differences in average values show that the average of the five variable has a higher value in cluster 2 which indicates a better level of welfare than cluster 1. Keywords: ROCK ensemble cluster, agglomerative, people’s welfare, characteristics

Citation



    SERVICES DESK