PENDETEKSIAN PENIPUAN TRANSAKSI KARTU KREDIT DENGAN ALGORITMA LIGHTGBM DAN SUPPORT VECTOR MACHINES MENGGUNAKAN SISTEM TERDISTRIBUSI HADOOP | ELECTRONIC THESES AND DISSERTATION

Electronic Theses and Dissertation

Universitas Syiah Kuala

    SKRIPSI

PENDETEKSIAN PENIPUAN TRANSAKSI KARTU KREDIT DENGAN ALGORITMA LIGHTGBM DAN SUPPORT VECTOR MACHINES MENGGUNAKAN SISTEM TERDISTRIBUSI HADOOP


Pengarang

Teuku Nabil Muhammad Dhuha - Personal Name;

Dosen Pembimbing

Taufik Fuadi Abidin - 197010081994031002 - Dosen Pembimbing I
Laina Farsiah - 198902032022032004 - Dosen Pembimbing II



Nomor Pokok Mahasiswa

2008107010004

Fakultas & Prodi

Fakultas MIPA / Informatika (S1) / PDDIKTI : 55201

Subject
-
Kata Kunci
-
Penerbit

Banda Aceh : Fakultas mipa., 2024

Bahasa

No Classification

-

Literature Searching Service

Hard copy atau foto copy dari buku ini dapat diberikan dengan syarat ketentuan berlaku, jika berminat, silahkan hubungi via telegram (Chat Services LSS)

Penelitian ini bertujuan untuk membandingkan kinerja dua model pembelajaran mesin, yaitu Support Vector Machines (SVM) dan LightGBM, dalam mendeteksi penipuan pada transaksi kartu kredit menggunakan Hadoop. Hasil penelitian menunjukkan bahwa model LightGBM secara konsisten unggul dibandingkan SVM dalam hal akurasi, precision, recall, dan F1-score, terutama dalam menghadapi dataset yang tidak seimbang. Pada dataset yang tidak seimbang, LightGBM berhasil mencapai akurasi 99,31% dan F1-score 93,75%, sedangkan SVM hanya mencapai akurasi 80,99% dan F1-score 83,31%. LightGBM juga menunjukkan performa yang lebih baik pada dataset seimbang dengan akurasi 98,72% dan F1-score 98,72%, dibandingkan SVM yang hanya mencapai 89,85% dan F1-score 89,68%. SVM terbukti sensitif terhadap ketidakseimbangan data sehingga memerlukan proses resampling untuk meningkatkan performanya. Di sisi lain, LightGBM lebih efektif dalam menangani data yang tidak seimbang, meskipun memerlukan proses balancing untuk mencapai kinerja yang optimal. Selain itu, analisis visualisasi data menunjukkan adanya pola musiman dan harian dalam kasus penipuan, dengan peningkatan signifikan pada bulan Desember dan pada rentang waktu malam hari, antara pukul 23.00 hingga 4.00 pagi. Penelitian ini menyimpulkan bahwa LightGBM lebih tepat digunakan untuk deteksi penipuan kartu kredit, baik pada dataset yang tidak seimbang maupun dataset yang seimbang.

Kata kunci: Penipuan Kartu Kredit, LightGBM, SVM, Hadoop, Ketidakseimbangan Data.

This study aims to compare the performance of two machine learning models, namely Support Vector Machines (SVM) and LightGBM, in detecting credit card fraud using Hadoop. The results indicate that the LightGBM model consistently outperforms SVM in terms of accuracy, precision, recall, and F1-score, especially when handling imbalanced datasets. On the imbalanced dataset, LightGBM achieved an accuracy of 99.31% and an F1-score of 93.75%, while SVM only managed an accuracy of 80.99% and an F1-score of 83.31%. LightGBM also demonstrated better performance on the balanced dataset with an accuracy of 98.72% and an F1-score of 98.72%, compared to SVM, which only achieved 89.85% accuracy and an F1-score of 89.68%. SVM was shown to be sensitive to data imbalance, requiring resampling processes to improve its performance. On the other hand, LightGBM proved to be more effective in handling imbalanced data, although balancing was still necessary to reach optimal performance. Additionally, data visualization analysis revealed seasonal and daily patterns in fraud cases, with a significant increase in December and during nighttime, between 11:00 PM and 4:00 AM. This study concludes that LightGBM is more suitable for credit card fraud detection, whether on imbalanced or balanced datasets. Keywords: Credit Card Fraud, LightGBM, SVM, Hadoop, Data Imbalance.

Citation



    SERVICES DESK