Electronic Theses and Dissertation
Universitas Syiah Kuala
SKRIPSI
DETEKSI OUTLIER DATA KESEJAHTERAAN RUMAH TANGGA PADA KOTA DI ACEH MENGGUNAKAN CLUSTERING BERBASIS K-MODES DAN K-MEDOIDS
Pengarang
Al Haridt Mahmudi - Personal Name;
Dosen Pembimbing
Ridha Ferdhiana - 197302141998022001 - Dosen Pembimbing I
Marzuki - 197802212005011004 - Dosen Pembimbing II
Nomor Pokok Mahasiswa
2008108010004
Fakultas & Prodi
Fakultas MIPA / Statistika (S1) / PDDIKTI : 49201
Subject
Kata Kunci
Penerbit
Banda Aceh : Fakultas mipa., 2024
Bahasa
No Classification
-
Literature Searching Service
Hard copy atau foto copy dari buku ini dapat diberikan dengan syarat ketentuan berlaku, jika berminat, silahkan hubungi via telegram (Chat Services LSS)
Outlier merupakan data yang berada jauh atau terpencil dari populasi. Kehadiran outlier berimplikasi pada analisis data seperti menyebabkan bentuk distribusi data menjadi tidak normal, menciptakan bias dalam taksiran parameter serta berpengaruh terhadap hasil signifikansi pengujian parameter. Deteksi outlier dalam data dapat memberikan informasi penting yang berguna dalam pengambilan keputusan kebijakan publik, khususnya dalam meningkatkan kesejahteraan masyarakat. Metode mencari outlier salah satunya adalah clustering yang mendefinisikan data sebagai outlier jika tidak terdapat dalam klaster tersebut atau secara implisit mendefinisikan outlier sebagai noise dari suatu klaster. Penelitian ini bertujuan untuk memperbaiki kategori status dan mendeteksi outlier dalam data status kesejahteraan rumah tangga pada kota di Aceh dengan menggunakan metode clustering berbasis K-modes dan K-medoids. Temuan ini diharapkan dapat memberikan kontribusi dalam perumusan kebijakan yang lebih tepat sasaran untuk meningkatkan kesejahteraan rumah tangga pada kota di Aceh. Penelitian ini menggunakan K-modes dengan jarak hamming dan K-medoids dengan jarak manhattan. Kedua metode tersebut diterapkan untuk memperbaiki status kesejahteraan rumah tangga serta mendeteksi outlier pada data tersebut. Data yang digunakan dalam penelitian ini mencakup berbagai variabel yang memengaruhi status kesejahteraan rumah tangga pada kota di Aceh pada tahun 2019 yang didata oleh Bappeda Aceh. Proses memperbaiki kategori status kesejahteraan rumah tangga dilakukan dengan membandingkan jarak terdekat amatan ke pusat klaster. Hasil analisis menunjukkan bahwa metode K-medoids memiliki akurasi yang lebih baik dibandingkan dengan K-modes dalam memperbaiki kategori status kesejahteraan rumah tangga yakni sebesar 0,9617. Hasil deteksi outlier menggunakan K-medoids menunjukkan terdapat outlier sebanyak 2.326 dari 60.744 data. Pengujian model Decision Tree menggunakan data yang diperbaiki dan tanpa outlier menghasilkan akurasi yang lebih bagus sebesar 0,9837. Hasil ini lebih bagus dibandingkan dengan data asli status kesejahteraan.
Outliers are data that are far or remote from the population. The presence of outliers has implications for data analysis such as causing the shape of the data distribution to become abnormal, creating bias in parameter estimates and affecting the results of parameter test significance. Detecting outliers in data can provide important information that is useful in making public policy decisions, especially in improving people's welfare. One method of finding outliers is clustering which defines data as outliers if it is not contained in the cluster or implicitly defines outliers as noise from a cluster. This study aims to improve the status category and detect outliers in household welfare status data in Aceh municipalities by using clustering methods based on K-modes and K-medoids. The findings are expected to contribute to the formulation of more targeted policies to improve household welfare in cities in Aceh. This research uses K-modes with hamming distance and K-medoids with manhattan distance. Both methods are applied to improve household welfare status and detect outliers in the data. The data used in this study includes various variables that affect the welfare status of households in municipalities in Aceh in 2019 as recorded by Bappeda Aceh. The process of improving the household welfare status category is done by comparing the closest distance of the observations to the cluster center. The analysis results show that the K-medoids method has better accuracy than K-modes in improving the household welfare status category, which is 0.9617. The results of outlier detection using K-medoids show that there are 2,326 outliers out of 60,744 data. Testing the Decision Tree model using the corrected data and without outliers produces a better accuracy of 0.9837. This result is better than the original welfare status data.
PERBANDINGAN KINERJA K-MODES DAN K-MEDOIDS CLUSTERING PADA DATA STATUS KESEJAHTERAAN RUMAH TANGGA BERTIPE KATEGORI ORDINAL (STUDI KASUS: 9 KABUPATEN PROVINSI ACEH) (Nanda Salsabila, 2024)
K-NEAREST NEIGHBOR MENGGUNAKAN UKURAN KEMIRIPAN POLYCHORIC CORRELATION UNTUK DETEKSI OUTLIER (STUDI KASUS: STATUS KESEJAHTERAAN KELUARGA KOTA BANDA ACEH) (NADYA RISMA NAMIRA, 2025)
PERBANDINGAN K-MODES CLUSTERING DAN ROCK CLUSTERING TERHADAP INDIKATOR KEMISKINAN DI KECAMATAN SAMADUA KABUPATEN ACEH SELATAN (Muhammad Iqbal, 2019)
IDENTIFIKASI FITUR-FITUR PENENTUAN STATUS KESEJAHTERAAN RUMAH TANGGA MENGGUNAKAN KLASIFIKASI DECISION TREE DAN NAÏVE BAYES (STUDI KASUS: 9 KABUPATEN PROVINSI ACEH) (Devira Marshanda, 2024)
PENGGUNAAN KLASIFIKASI NAÏVE BAYES DAN DECISION TREE DALAM MENGIDENTIFIKASI VARIABEL-VARIABEL PENENTU STATUS KESEJAHTERAAN RUMAH TANGGA (STUDI KASUS: 9 KABUPATEN DENGAN PERSENTASE KEMISKINAN TERTINGGI DI ACEH) (PUTRI NADHIFA, 2024)