EKSPLORASI TEKNIK MACHINE LEARNING UNTUK PENINGKATAN KUANTIFIKASI ASAM KLOROGENAT DALAM BIJI KOPI MENGGUNAKAN NEAR-INFRARED SPECTROSCOPY | ELECTRONIC THESES AND DISSERTATION

Electronic Theses and Dissertation

Universitas Syiah Kuala

    THESES

EKSPLORASI TEKNIK MACHINE LEARNING UNTUK PENINGKATAN KUANTIFIKASI ASAM KLOROGENAT DALAM BIJI KOPI MENGGUNAKAN NEAR-INFRARED SPECTROSCOPY


Pengarang

M. Haekal Alfanshury - Personal Name;

Dosen Pembimbing

Agus Arip Munawar - 198008092003121003 - Dosen Pembimbing I
Hizir - 196805311993031003 - Dosen Pembimbing I



Nomor Pokok Mahasiswa

2208207010009

Fakultas & Prodi

Fakultas / / PDDIKTI :

Subject
-
Kata Kunci
-
Penerbit

Banda Aceh : Fakultas MIPA (S2)., 2025

Bahasa

No Classification

-

Literature Searching Service

Hard copy atau foto copy dari buku ini dapat diberikan dengan syarat ketentuan berlaku, jika berminat, silahkan hubungi via telegram (Chat Services LSS)

Asam klorogenat (CGA) merupakan senyawa bioaktif utama dalam biji kopi yang sangat penting untuk penilaian kualitas dan manfaat kesehatan. Metode kuantifikasi tradisional seperti Kromatografi Cair Kinerja Tinggi (HPLC) memerlukan waktu dan sumber daya yang besar. Studi ini mengeksplorasi potensi Spektroskopi Inframerah Dekat (Near-Infrared Spectroscopy/NIRS) yang dikombinasikan dengan berbagai algoritma pembelajaran mesin (machine learning/ML) serta teknik koreksi spektral untuk meningkatkan kuantifikasi CGA dalam biji kopi, sebagai alternatif yang cepat dan non-destruktif. Dataset yang digunakan terdiri dari 74 sampel biji kopi hijau utuh jenis Arabika dan Robusta, dengan data NIRS diperoleh pada rentang 1000–2500 nm dan kandungan CGA acuan ditentukan menggunakan HPLC.

Untuk meningkatkan kualitas data spektral, diterapkan dua metode praproses yaitu Multiplicative Scatter Correction (MSC) dan Standard Normal Variate (SNV). Enam model regresi ML dievaluasi: K-Nearest Neighbors (KNN), Support Vector Regression (SVR), Random Forest Regression (RFR), Gradient Boosting Regression (GBR), Extreme Gradient Boosting (XGBoost), dan Natural Gradient Boosting (NGBoost), beserta kombinasi ensemble-nya. Kinerja model dievaluasi menggunakan metrik koefisien determinasi (R²), Root Mean Squared Error (RMSE), dan Rasio Deviasi Prediksi (RPD).

Hasil menunjukkan bahwa model NGBoost yang dilatih pada data MSC memberikan performa terbaik di antara model tunggal, dengan R² validasi sebesar 0,93 dan RPD sebesar 3,67, menunjukkan akurasi prediktif dan kemampuan generalisasi yang unggul. Sementara itu, model ensemble terbaik (XGBoost + GBR) juga menunjukkan performa kuat (R² = 0,88, RPD = 2,88 pada data MSC), namun NGBoost terbukti lebih andal. Secara umum, MSC menghasilkan performa model yang sedikit lebih baik dibandingkan SNV, menunjukkan efektivitasnya dalam menyediakan input spektral yang lebih bersih. Studi ini juga menyoroti pentingnya pengelolaan kompleksitas model, di mana Random Forest secara konsisten menunjukkan gejala overfitting. Penelitian ini menegaskan bahwa kombinasi NGBoost dengan praproses MSC memberikan solusi yang sangat akurat dan andal untuk kuantifikasi CGA secara non-destruktif pada biji kopi, yang bermanfaat bagi pengendalian kualitas dalam industri kopi.

Chlorogenic acid (CGA) is a key bioactive compound in coffee beans, crucial for quality assessment and health benefits. Traditional quantification methods like HPLC are time-consuming and resource-intensive. This study explores the potential of Near-Infrared Spectroscopy (NIRS) combined with various machine learning (ML) algorithms and spectral correction techniques to enhance CGA quantification in coffee beans, offering a rapid, non-destructive alternative. We utilized a dataset of 74 intact Arabica and Robusta green coffee bean samples, with NIRS data acquired from 1000-2500 nm and reference CGA content determined by HPLC. Multiplicative Scatter Correction (MSC) and Standard Normal Variate (SNV) were applied for spectral preprocessing to improve data quality. Six ML regression models were evaluated: K-Nearest Neighbors (KNN), Support Vector Regression (SVR), Random Forest Regression (RFR), Gradient Boosting Regression (GBR), Extreme Gradient Boosting (XGBoost), and Natural Gradient Boosting (NGBoost), alongside ensemble combinations. Model performance was assessed using R-squared (R²), Root Mean Squared Error (RMSE), and Ratio of Prediction Deviation (RPD). Results show that the NGBoost model trained on the MSC-corrected dataset achieved the highest performance among single models, with a validation R² of 0.93 and an RPD of 3.67, demonstrating superior predictive accuracy and generalization. While the best ensemble model (XGBoost + GBR) also performed strongly (R²=0.88, RPD = 2.88 on MSC), NGBoost proved more robust. MSC generally led to slightly better model performance compared to SNV, indicating its effectiveness in providing cleaner spectral inputs. The study also highlighted the importance of model complexity management, as Random Forest consistently exhibited overfitting. This research confirms that a combination of NGBoost with MSC preprocessing offers a highly accurate and robust solution for non-destructive CGA quantification in coffee beans, valuable for quality control in the coffee industry.

Citation



    SERVICES DESK