Universitas Syiah Kuala | ELECTRONIC THESES AND DISSERTATION

Electronic Theses and Dissertation

Universitas Syiah Kuala

    SKRIPSI
Malfirah, PENANGANAN DATA HILANG MENGGUNAKAN METODE IMPUTASI PADA DATA IKLIM DI KABUPATEN ACEH UTARA. Banda Aceh Fakultas MIPA Statistika,2024

Ketersediaan data iklim di kabupaten aceh utara memiliki beberapa permasalahan yang kompleks terkait dengan kesempurnaan data. permasalahan yang terjadi saat pengumpulan data di kabupaten aceh utara adalah kurangnya keakuratan dan kelengkapan data yang menyebabkan data tersebut mengalami data hilang. oleh karena itu, perlu dilakukan penanganan terhadap data hilang tersebut. terdapat beberapa metode yang dapat digunakan untuk imputasi data hilang tersebut, yaitu predictive mean matching (pmm), expectation maximization (em) algorithm, dan hot-deck (hd) imputation. metode-metode ini dinilai berdasarkan kemampuan mereka dalam mengelola data yang hilang tiap variabel yang mewakili temperatur, kelembapan, curah hujan, lamanya penyinaran matahari, dan kecepatan angin dari tahun 2010 hingga 2023. metode imputasi dievaluasi menggunakan statistik deskriptif, uji normalitas, uji homogenitas, dan uji kruskal-wallis untuk membandingkan hasil imputasi dan menentukan metode yang paling efektif. tujuan penelitian ini adalah membandingkan dan menemukan metode imputasi terbaik dalam menangani data hilang pada data iklim di kabupaten aceh utara. hasil penelitian menunjukkan bahwa hd imputation secara konsisten melestarikan karakteristik data asli dan merupakan metode terbaik dalam menangani data hilang. sehingga sangat efektif dan tepat digunakan dalam menangani data hilang. kata kunci: predictive mean matching, expectation maximization algorithm, hot-deck imputation, uji normalitas, uji homogenitas, kruskal-wallis.



Abstract

The availability of climate data in North Aceh District presents several complex issues related to data completeness. The problem encountered during data collection in North Aceh District is the lack of accuracy and completeness of the data, resulting in missing data. Therefore, it is necessary to address this missing data. There are several methods that can be used for the imputation of this missing data, namely Predictive Mean Matching (PMM), Expectation Maximization (EM) Algorithm, and Hot-Deck (HD) Imputation. These methods are evaluated based on their ability to manage missing data for each variable representing temperature, humidity, rainfall, sunshine duration, and wind speed from 2010 to 2023. The imputation methods were assessed using descriptive statistics, normality tests, homogeneity tests, and the Kruskal-Wallis test to compare imputation outcomes and determine the most effective method. The purpose of this study is to compare and find the best imputation method in handling missing climate data in North Aceh District. The results show that HD Imputation consistently preserves the characteristics of the original data and is the best method in handling missing data. So it is very effective and appropriate to use in handling missing data. Keywords: Predictive Mean Matching, Expectation Maximization Algorithm, Hot-Deck Imputation, Normality Test, Homogeneity Test, Kruskal-Wallis.



    SERVICES DESK