Diabetes merupakan salah satu penyakit kronis yang prevalensinya terus meningkat di seluruh dunia, termasuk di indonesia. penurunan kesehatan yang disebabkan oleh pola hidup tidak sehat berisiko tinggi menyebabkan diabetes. oleh karena itu, deteksi ini sangat penting agar tindakan pencegahan dapat segera dilakukan. penelitian ini dilakukan untuk memprediksi kasus diabetes menggunakan teknik data mining yaitu klasifikasi, yang termasuk kategori supervised learning. penelitian ini menggunakan dua algoritma populer yaitu random forest dan support vector machine (svm) untuk mengklasifikasikan kasus diabetes. data yang digunakan pada penelitian ini adalah data kasus diabetes yang bersumber dari website kaggle. penelitian ini bertujuan untuk membandingkan performa dua algoritma tersebut dan mendapatkan tingkat kepentingan variabel penentu diabetes. penelitian ini juga menerapkan teknik synthetic minority over-sampling technique (smote), adaptive synthetic sampling (adasyn), dan random under-sampler (rus) untuk menangani ketidakseimbangan data. hasil yang diperoleh menunjukkan model random forest mendapatkan nilai akurasi tertinggi sebesar 95%. sedangkan model svm mendapatkan nilai akurasi tertinggi sebesar 93%. sehingga dapat disimpulkan random forest lebih baik dalam mengklasifikasikan data kasus diabetes. selain itu didapatkan juga bahwa smote dan rus lebih baik dalam menangani ketidakseimbangan data. sementara itu lima variabel paling menentukan kasus diabetes yaitu hba1c level (x7), blood glucose level (x8), age (x2), body mass index (bmi) (x6), dan hypertension (x3). dengan demikian, dapat disimpulkan bahwa kelima variabel tersebut memiliki kontribusi yang signifikan dalam menentukan kasus diabetes.
Electronic Theses and Dissertation
Universitas Syiah Kuala
SKRIPSI
PERBANDINGAN PERFORMA ALGORITMA RANDOM FOREST DAN SUPPORT VECTOR MACHINE DALAM MENGKLASIFIKASIKAN KASUS DIABETES. Banda Aceh Fakultas MIPA Statistika,2025
Baca Juga : PERBANDINGAN METODE SUPPORT VECTOR MACHINE DAN RANDOM FOREST PADA CITRA SENTINEL-2A UNTUK IDENTIFIKASI TUTUPAN LAHAN KOTA BANDA ACEH MENGGUNAKAN GOOGLE EARTH ENGINE (Safira, 2024)
Abstract
Diabetes is a chronic disease whose prevalence continues to increase throughout the world, including in Indonesia. Decreased health caused by an unhealthy lifestyle has a high risk of causing diabetes. Therefore, early detection is very important so that preventive measures can be taken immediately. Early research was carried out to predict diabetes cases using data mining techniques, namely classification, which is included in the supervised learning category. The research used two popular algorithms, namely Random Forest and Support Vector Machine (SVM) to classify diabetes cases. The data used in this research is diabetes case data sourced from the Kaggle website. This study aims to compare the performance of the two algorithms and obtain the level of importance of variables in determining diabetes. This research also applies the Synthetic Minority Over-sampling Technique (SMOTE), Adaptive Synthetic Sampling (ADASYN), and Random Under-sampler (RUS) techniques to handle data imbalance. The results obtained show that the Random Forest model obtained the highest accuracy value of 95%. Meanwhile, the SVM model got the highest accuracy value of 93%. So it can be concluded that Random Forest is better at classifying diabetes case data. Apart from that, it was also found that SMOTE and RUS were better at handling data imbalances. Meanwhile, the five variables that most determine diabetes cases are HbA1c Level (X7), Blood Glucose Level (X8), Age (X2), Body Mass Index (BMI) (X6), and Hypertension (X3). Thus, it can be concluded that these five variables have a significant contribution in determining diabetes cases.
Baca Juga : KLASIFIKASI INDEKS KETAHANAN PANGAN DI INDONESIA TAHUN 2023 MENGGUNAKAN METODE SUPPORT VECTOR MACHINES (SVM) (Putri Rianti Wulandari, 2025)