Abstrak peningkatan jumlah pasien kanker menimbulkan permasalahan dalam melakukan proses pengobatan dengan metode kemoterapi yang menyebabkan penderita harus melakukan tes darah sebelum menjalani proses kemoterapi. dikarenakan kemoterapi dapat berbahaya bagi sebagian penderita kanker, maka penderita memiliki 3 kategori agar bisa menjalani proses kemoterapi yaitu penderita dapat melakukan kemoterapi jika neutrophil dalam darah harus berada lebih besar dari 1500 unit, jika neutrophil dalam darah berkisar antara 1000-1500 unit maka penderita harus mengecek kembali hasil tes darah, dan jika neutrophil dalam darah berada di bawah 1000 unit maka penderita tidak dapat melakukan kemoterapi karena dapat berbahaya bagi penderita. maka dari itu, dibutuhkan sebuah sistem yang dapat mengklasifikasi hasil tes darah penderita kanker ke dalam kategori tersebut secara otomatis. penelitian ini menggunakan metode support vector machine (svm), k-nearest neighbor (knn), naïve bayes, dan decision tree serta dengan membandingkan algoritma dengan menggunakan 3 buah variabel (anc) dan 18 buah variabel berdasarkan data asli. implementasi metode svm, knn, naïve bayes dan decision tree dilakukan dengan menggunakan library sklearn dengan bahasa pemograman python. dataset yang digunakan diambil dari biolab banda aceh sebanyak 2.834 data yang terdiri dari 3 kategori. hasil penelitian dengan k=10 cross validation menunjukkan bahwa model knn terbaik dalam mengklasifikasi data hasil tes darah penderita kanker yaitu dengan akurasi pada tahap training sebesar 100% dan tahap testing sebesar 85.53%. berdasarkan analisis hasil klasifikasi menggunakan metode knn selanjutnya digunakan untuk melihat pengaruh dari jumlah variabel yang digunakan, hasil penelitian menunjukkan performa dengan menggunakan algoritma anc lebih unggul dengan nilai akurasi 98.94%. kata kunci: hasil tes darah penderita kanker, klasifikasi, support vector machine, k-nearest neighbor, naïve bayes, decision tree, neutrophil, k-fold cross validation
Electronic Theses and Dissertation
Universitas Syiah Kuala
SKRIPSI
KLASIFIKASI PASIEN KANKER LAYAK KEMOTERAPI BERDASARKAN DATA HASIL TES DARAH MENGGUNAKAN METODE SVM, K-NN, NAïVE BAYES, DAN DECISION TREE. Banda Aceh Fakultas MIPA - Informatika,2023
Baca Juga : IDENTIFIKASI FITUR-FITUR PENENTUAN STATUS KESEJAHTERAAN RUMAH TANGGA MENGGUNAKAN KLASIFIKASI DECISION TREE DAN NAÏVE BAYES (STUDI KASUS: 9 KABUPATEN PROVINSI ACEH) (Devira Marshanda, 2024)
Abstract
ABSTRACT Increasing the number of cancer patients causes problems in carrying out the treatment process with the chemotherapy method which causes sufferers to have to do blood tests before undergoing the chemotherapy process. Because chemotherapy can be dangerous for some cancer sufferers, sufferers have 3 categories in order to be able to undergo the chemotherapy process, namely sufferers can do chemotherapy if the neutrophils in the blood must be greater than 1500 units, if the neutrophils in the blood range between 1000-1500 units then the patient must check return blood test results, and if the neutrophils in the blood are below 1000 units then the patient cannot do chemotherapy because it can be dangerous for the patient. Therefore, we need a system that can classify blood test results of cancer patients into these categories automatically. This study uses the Support Vector Machine (SVM), K-Nearest Neighbor (KNN), Naïve Bayes, and Decision Tree methods and compares algorithms using 3 variables (ANC) and 18 variables based on original data. The implementation of the SVM, KNN, Naïve Bayes and Decision Tree methods is carried out using the Sklearn Library with the Python programming language. The dataset used was taken from the Banda Aceh BioLab as many as 2,834 data consisting of 3 categories. The results of the study with k = 10 cross validation showed that the KNN model was the best in classifying data on blood test results for cancer patients with an accuracy of 100% in the training stage and 85.53% in the testing stage. Based on the analysis of the results of the classification using the KNN method, it is then used to see the effect of the number of variables used, the results of the study show that the performance using the ANC algorithm is superior with an accuracy value of 98.94%. Keywords: Cancer blood test results, Classification, Support Vector Machine, K-Nearest Neighbor, Naïve Bayes, Decision Tree, neutrophils, K-Fold Cross Validation
Baca Juga : ANALISIS PERBANDINGAN PERFORMA NAïVE BAYES DAN NAïVE BAYES ADABOOST DALAM MENGKLASIFIKASIKAN INDEKS KETAHANAN PANGAN DI PULAU SUMATRA (IMAM GHAFFARI AZHAR, 2025)