PERBANDINGAN PERFORMA ALGORITMA KLASIFIKASI DECISION TREE DAN K-NEAREST NEIGHBOR PADA DATA PLUME AIR QUALITY INDEX DI INDONESIA | ELECTRONIC THESES AND DISSERTATION

Electronic Theses and Dissertation

Universitas Syiah Kuala

    SKRIPSI

PERBANDINGAN PERFORMA ALGORITMA KLASIFIKASI DECISION TREE DAN K-NEAREST NEIGHBOR PADA DATA PLUME AIR QUALITY INDEX DI INDONESIA


Pengarang

Siti Ramadeska - Personal Name;

Dosen Pembimbing

Zurnila Marli Kesuma - 196903061994122001 - Dosen Pembimbing I



Nomor Pokok Mahasiswa

1908108010027

Fakultas & Prodi

Fakultas MIPA / Statistika (S1) / PDDIKTI : 49201

Subject
-
Kata Kunci
-
Penerbit

Banda Aceh : Fakultas MIPA Statistika., 2023

Bahasa

No Classification

-

Literature Searching Service

Hard copy atau foto copy dari buku ini dapat diberikan dengan syarat ketentuan berlaku, jika berminat, silahkan hubungi via telegram (Chat Services LSS)

Pencemaran udara memiliki dampak negatif pada kesehatan manusia, lingkungan, dan ekonomi. Masalah pencemaran udara telah sampai pada tingkat yang mengkhawatirkan. Hal ini ditandai dengan semakin banyaknya zat-zat polutan yang dihasilkan dari aktivitas sehari-hari seperti banyaknya pabrik industri, pembangkit listrik, dan kendaraan bermotor yang setiap harinya menghasilkan polutan yang dapat mencemari udara bersih. Beberapa daerah di Indonesia memiliki tingkat polusi udara yang jauh lebih buruk daripada rata-rata nasional. Oleh karena itu, diperlukan upaya untuk memantau dan mengendalikan kualitas udara di Indonesia. Salah satu cara sistem yang dapat mengukur kualitas udara adalah melalui Plume Air Quality Index (PAQI). PAQI adalah indeks yang digunakan untuk menentukan tingkat kualitas udara berdasarkan polutan udara, yaitu partikulat (PM2.5 dan PM10), nitrogen dioksida (NO2), dan ozon (O3). PAQI dihitung dengan menggunakan data hasil pengukuran konsentrasi pencemar udara dan memberikan nilai indeks yang berkaitan dengan tingkat pencemaran udara pada kategori tertentu. Untuk melihat keakuratan dalam pengklasifikasian kategori PAQI dilakukan pengolahan data menggunakan algoritma klasifikasi. Dalam penelitian ini akan dilakukan perbandingan algoritma klasifikasi decision tree dan K-Nearest Neighbor (K-NN). Perbandingan dilakukan mendapatkan algoritma yang memiliki performa paling baik dengan 3 skenario pengujian, yakni rasio pembagian data latih dan data uji 70:30, 80:20, dan 90:10. Hasil dari perbandingan performa kedua algoritma pada penelitian ini adalah decision tree memiliki performa terbaik dengan parameter criterion gini, max depth sebesar 5, min samples leaf sebesar 1 sampel, dan min samples split sebesar 2 sampel. Hasil perhitungan masing-masing metrik performa, yaitu nilai accuracy 91,94%, nilai precision 92,12%, nilai recall 91,94%, dan nilai f1-score 91,90%. Sehingga dapat disimpulkan bahwa hasil pengujian menggunakan decision tree memiliki performa yang lebih baik daripada K-NN dalam mengklasifikasi kategori PAQI dengan nilai metrik evaluasi yang lebih baik secara keseluruhan.

Kata Kunci: Kualitas Udara, Klasifikasi, Decision tree, K-Nearest Neighbor

Air pollution has negative impacts on human health, the environment and the economy. The problem of air pollution has reached an alarming level. It is characterized by the increasing number of pollutant substances produced from daily activities such as many industrial plants, power plants, and motor vehicles that produce pollutants that can pollute clean air every day. Some areas in Indonesia have air pollution levels that are much worse than the national average. Therefore, efforts are needed to monitor and control air quality in Indonesia. One way a system can measure air quality is through the Plume Air Quality Index (PAQI). PAQI is an index used to determine air quality levels based on air pollutants, namely particulates (PM2.5 and PM10), nitrogen dioxide (NO2), and ozone (O3). PAQI is calculated using measured data on air pollutant concentrations and provides an index value related to the level of air pollution in a particular category. To see the accuracy in classifying PAQI categories, data processing is carried out using classification algorithms. In this study, a comparison of decision tree and K-Nearest Neighbor (K-NN) classification algorithms will be conducted. The comparison is carried out to find the algorithm that has the best performance with 3 test scenarios, namely the ratio of training data and test data division of 70:30, 80:20, and 90:10. The result of the performance comparison of the two algorithms in this study is that the decision tree has the best performance with criterion parameters gini, max depth of 5, min samples leaf of 1 sample, and min samples split of 2 samples. The calculation results of each performance metric, namely the accuracy value of 91.94%, precision value of 92.12%, recall value of 91.94%, and f1-score value of 91.90%. So it can be concluded that the test results using decision tree have better performance than K-NN in classifying PAQI categories with better overall evaluation metric values. Keywords: Air Quality, Classification, Decision tree, K-Nearest Neighbor

Citation



    SERVICES DESK