Universitas Syiah Kuala | ELECTRONIC THESES AND DISSERTATION

Electronic Theses and Dissertation

Universitas Syiah Kuala

    SKRIPSI
Radhita Putri, PERBANDINGAN KLASIFIKASI DATA STIGMA PADA PENDERITA TUBERKULOSIS PARU DI KABUPATEN SIMEULUE MENGGUNAKAN RANDOM FOREST DAN K-NEAREST NEIGHBOR. Banda Aceh Fakultas MIPA Statistika,2025

Tuberkulosis (tb) merupakan penyakit menular yang menjadi salah satu masalah kesehatan secara global dan menghasilkan stigma di masyarakat. stigma yang diberikan dapat mempengaruhi angka kesembuhan bagi penderita tb paru dan terbagi menjadi 2 yaitu, positif dan negatif. pengelompokan tersebut dapat dianalisis menggunakan metode klasifikasi random forest dan k-nearest neighbor kemudian variabel yang mempengaruhi stigma tersebut akan dijelaskan oleh metode shapley additive explanation (shap) yang dapat menginterpretasi pengaruh variabel secara sederhana. penelitian ini menggunakan data hasil survei yang dilakukan oleh saima fitri di kabupaten simeulue pada tahun 2021. tujuan dari penelitian ini untuk mengetahui metode klasifikasi terbaik serta mengidentifikasi variabel yang mempengaruhi stigma secara berurutan. hasil dari penelitian ini menunjukkan bahwa klasifikasi random forest menghasilkan hasil kinerja klasifikasi lebih baik dibandingkan k-nearest neighbor dengan nilai accuracy sebesar 80,00%; precission sebesar 88,86%; recall sebesar 66,67%; f1-score sebesar 68,75%. sementara itu 4 variabel dengan kontribusi tertinggi terhadap stigma secara berurutan adalah persepsi (x_8), sosial budaya (x_{10}), faktor psikologis (x_9), dan pengetahuan (x_7).



Abstract

Tuberculosis is an infectious disease that is a global health problem and produces stigma in society. The stigma given can influence the recovery rate for pulmonary TB sufferers and is divided into 2, namely, positive and negative. These groupings can be analyzed using the Random Forest and K-Nearest Neighbor classification methods, then the variables that influence stigma will be explained by the Shapley Additive exPlanation (SHAP) method which can interpret the influence of variables in a simple way. This research uses data from a survey conducted by Saima Fitri in Simeulue Regency in 2021. The aim of this research is to find out the best classification method and identify variables that influence stigma sequentially. The results of this research show that Random Forest classification produces better classification performance results than K-Nearest Neighbor with an accuracy value of 80.00%; precision of 88.86%; recall of 66.67%; f1-score of 68.75%. Meanwhile, the 4 variables with the highest contribution to stigma are perception (X_8), socio-cultural (X_{10}), psychological factors (X_9), and knowledge (X_7).



    SERVICES DESK