Penelitian ini bertujuan untuk mendeteksi outlier pada data status kesejahteraan keluarga di kota banda aceh menggunakan metode k-nearest neighbor (knn) yang disempurnakan dengan ukuran kemiripan polychoric correlation. data yang digunakan berjumlah 12.561 responden dan seluruhnya mencakup variabel kategorik ordinal yang terkait dengan kesejahteraan keluarga. penggunaan polychoric correlation dipilih untuk menangani sifat data kategorik ordinal yang sulit di analisis dengan metode konvensional. penelitian ini menggunakan 4 nilai threshold yaitu 1; 1,2; 1,4; dan 1,6 untuk deteksi outlier. hasil penelitian menunjukkan bahwa threshold 1,6 memberikan hasil yang optimal dalam mengidentifikasi data yang benar-benar menyimpang. pembanding metode clustering juga diterapkan, namun hasilnya menunjukkan metode knn masih lebih unggul dalam mendeteksi outlier secara komprehensif. penelitian ini menyimpulkan bahwa metode knn dengan polychoric correlation efektif dalam mendeteksi anomali pada data kesejahteraan keluarga serta memberikan wawasan yang dapat digunakan untuk pengambilan keputusan kebijakan sosial yang lebih tepat di kota banda aceh. kata kunci: k-nearest neighbor, polychoric correlation, clustering, deteksi outlier, kesejahteraan keluarga, banda aceh
Electronic Theses and Dissertation
Universitas Syiah Kuala
SKRIPSI
K-NEAREST NEIGHBOR MENGGUNAKAN UKURAN KEMIRIPAN POLYCHORIC CORRELATION UNTUK DETEKSI OUTLIER (STUDI KASUS: STATUS KESEJAHTERAAN KELUARGA KOTA BANDA ACEH). Banda Aceh Fakultas MIPA Statistika,2025
Baca Juga : DETEKSI KANKER PAYUDARA BERBASIS FITUR CITRA TERMAL DAN KLASIFIKASI K-NEAREST NEIGHBOR (KNN) (Mentari Bella Al Rasyid, 2019)
Abstract
This study aims to detect outliers in family welfare data from Banda Aceh City by employing an enhanced K-Nearest Neighbor (KNN) method integrated with Polychoric Correlation similarity measure. The research utilized a comprehensive dataset comprising 12,561 respondents, exclusively consisting of ordinal categorical variables related to family welfare. Polychoric Correlation was strategically selected to address the complex analytical challenges inherent in ordinal categorical data that conventional methods struggle to analyze effectively. The reseach implemented four distinct threshold values (1; 1,2; 1,4; 1,6) for outlier detection. Empirical findings revealed that the 1,6 threshold provided the most optimal results in comprehensively identifying statistically significant data anomalies. Comparative clustering methods were also evaluated, demonstrating that the proposed KNN approach surpassed alternative techniques in robust outlier detection. The study conclusively establishes the effectiveness of the KNN method with Polychoric Correlation in detecting anomalies within family welfare datasets, thereby offering valuable insights for more precise social policy decision-making in Banda Aceh City. Keywords: K-Nearest Neighbor, Polychoric Correlation, Clustering, Outlier Detection, Family Welfare, Banda Aceh