Prediksi litologi menggunakan data log sumur merupakan proses penting dalam industri minyak dan gas untuk menentukan formasi geologi secara akurat. berbagai metode pembelajaran mesin telah digunakan untuk tugas ini, termasuk k-nearest neighbor (knn), random forest, dan support vector machine. meskipun metode ini memiliki keunggulan seperti kemampuan menangani klasifikasi multi-kelas, metode tersebut menghadapi tantangan signifikan terkait ketidakseimbangan kelas dan atribut yang bersifat noisy dalam dataset. ketidakseimbangan kelas dapat menyebabkan bias terhadap kelas mayoritas, sementara atribut yang bersifat noisy mengurangi kemampuan model dalam mendeteksi pola yang relevan, sehingga menurunkan akurasi prediksi. pendekatan konvensional seperti smote (synthetic minority oversampling technique) untuk mengatasi ketidakseimbangan kelas sering kali menghasilkan data sintetis yang memperbesar atribut yang bersifat noisy, sehingga meningkatkan risiko overfitting. selain itu, metode boosting seperti adaboost memperkuat prediksi dengan menggabungkan model lemah, tetapi masih rentan terhadap noise dalam data. untuk mengatasi keterbatasan ini, penelitian ini mengusulkan integrasi hybrid smote, adaboost, dan evolutionary algorithm. smote digunakan untuk menyeimbangkan distribusi kelas dengan menghasilkan data sintetis yang lebih bermakna. evolutionary algorithm diterapkan untuk seleksi fitur, meminimalkan atribut yang bersifat noisy, sementara adaboost meningkatkan ketahanan model terhadap overfitting. pendekatan yang diusulkan diuji menggunakan dua dataset publik, yaitu force 2020 dan kaggle. hasil eksperimen menunjukkan bahwa integrasi ini secara signifikan meningkatkan akurasi prediksi, mencapai 94.54%, precision 88,83%, recall 84,55%, f1-score 86,46% pada dataset force 2020 dan akurasi 70.11%, precision 57,06%, recall 55,05%, f1-score 55,86% pada dataset kaggle, lebih unggul dibandingkan metode konvensional. penelitian ini bertujuan untuk memberikan solusi inovatif yang lebih tangguh dalam menangani tantangan data geologi, memperbaiki akurasi prediksi litologi, dan menawarkan kontribusi yang substansial untuk aplikasi di industri minyak dan gas.
Electronic Theses and Dissertation
Universitas Syiah Kuala
THESES
HYBRID SMOTE-ADABOOST-EVOLUTIONARY ALGORITHM UNTUK MENGATASI KETIDAKSEIMBANGAN KELAS DAN ATRIBUT YANG BERSIFAT NOISY PADA DATA LOG SUMUR UNTUK PREDIKSI LITOLOGI DENGAN K-NEAREST NEIGHBOR. Banda Aceh Fakultas MIPA (S2),2025
Baca Juga : ANALISA FILOGENETIK FAMILI DIPTEROCARPACEAE BERDASARKAN DNA BARCODING MATK (Ulfi Maulida, 2014)
Abstract
Lithology prediction using well log data is a critical process in the oil and gas industry to accurately determine geological formations. Various machine learning methods, including K-Nearest Neighbor (KNN), Random Forest, and Support Vector Machine, have been applied to this task. While these methods offer advantages such as handling multi-class classification, they face significant challenges related to class imbalance and noisy attributes in the dataset. Class imbalance can cause bias toward majority classes, while noisy attributes reduce the model’s ability to detect relevant patterns, thereby lowering prediction accuracy. Conventional approaches such as SMOTE (Synthetic Minority Oversampling Technique) to address class imbalance often generate synthetic data that amplify noisy attributes, increasing the risk of overfitting. Furthermore, boosting methods like AdaBoost strengthen predictions by combining weak models but remain vulnerable to noise in the data. To address these limitations, this study proposes the integration of Hybrid SMOTE, AdaBoost, and Evolutionary Algorithm. SMOTE is used to balance class distributions by generating more meaningful synthetic data. The Evolutionary Algorithm is applied for feature selection to minimize noisy attributes, while AdaBoost enhances the model’s robustness against overfitting. The proposed approach was tested on two public datasets, FORCE 2020 and KAGGLE. Experimental results show that this integration significantly improves prediction accuracy, achieving 96.75%, precision 88,83%, recall 84,55%, F1-Score 86,46% on the FORCE 2020 dataset and 76.37%, 70.11%, precision 57,06%, recall 55,05%, F1-Score 55,86% on the KAGGLE dataset, outperforming conventional methods. This study aims to provide an innovative and robust solution to address geological data challenges, improve lithology prediction accuracy, and make substantial contributions to applications in the oil and gas industry.
Baca Juga : ANALISIS KLASIFIKASI DECISION TREE DAN ADABOOST PADA RUMAH TANGGA RAWAN PANGAN DI PROVINSI ACEH (Sahda Afifah, 2025)