Universitas Syiah Kuala | ELECTRONIC THESES AND DISSERTATION

Electronic Theses and Dissertation

Universitas Syiah Kuala

    SKRIPSI
Nuzulurrahmah, PENERAPAN OPTICAL CHARACTER RECOGNITION (OCR) DAN STRING MATCHING UNTUK MENDETEKSI KONTRAINDIKASI BAHAN FACECARE. Banda Aceh Fakultas MIPA (S1),2025

Penggunaan produk facecare yang tidak tepat secara bersamaan dapat menyebabkan reaksi negatif akibat kontraindikasi antar bahan aktif. penelitian ini bertujuan mengembangkan sistem yang mampu mengekstraksi daftar bahan dari label produk facecare dan mengidentifikasi potensi kontraindikasi antar bahan aktif. sistem dikembangkan menggunakan paddleocr untuk ekstraksi teks dari gambar label produk dan menerapkan rapidfuzz untuk penanganan kesalahan ejaan guna meningkatkan akurasi ekstraksi teks. algoritma string matching boyer-moore digunakan untuk mendeteksi bahan aktif dari hasil ekstraksi, dan rule-based system diterapkan untuk melakukan pengecekan kontraindikasi berdasarkan data kontraindikasi yang telah divalidasi oleh ahli dermatologi. pengujian dilakukan pada 50 produk dan didapatkan bahwa implementasi rapidfuzz berhasil meningkatkan akurasi pengenalan karakter paddleocr secara signifikan dari 76% menjadi 81%. selain itu, sistem yang dikembangkan menghasilkan keluaran analisis yang lebih konsisten dibandingkan pendekatan berbasis model llm (google gemini flash 2.0 dan deepseek-r1), yang cenderung memberikan hasil yang inkonsisten dalam analisis kontraindikasi pada pengujian berulang terhadap produk yang sama. kata kunci: facecare, kontraindikasi bahan, paddleocr, string matching, rapidfuzz, boyer-moore



Abstract

The improper use of facecare products at the same time can cause negative reactions due to contraindications between active ingredients. This study aims to develop a system capable of extracting ingredient lists from face care product labels and identifying potential contraindications between active ingredients. The system was developed using PaddleOCR for text extraction from product label images and RapidFuzz for spelling error handling to improve text extraction accuracy. The Boyer-Moore string matching algorithm was used to detect active ingredients from the extraction results, and a rule-based system was applied to check for contraindications based on contraindication data validated by dermatologists. Testing was conducted on 50 products, and it was found that the implementation of RapidFuzz significantly improved the character recognition accuracy of PaddleOCR from 76% to 81%. Additionally, the developed system produces more consistent analysis outputs compared to LLM-based approaches (Google Gemini Flash 2.0 and DeepSeek-R1), which tend to yield inconsistent results in contraindication analysis during repeated testing on the same product. Keywords: Facecare, Ingredient Contraindications, PaddleOCR, String Matching, RapidFuzz, Boyer-Moore



    SERVICES DESK