Universitas Syiah Kuala | ELECTRONIC THESES AND DISSERTATION

Electronic Theses and Dissertation

Universitas Syiah Kuala

    THESES
Fadhil Kasvi, DEEP LEARNING BERBASIS KONTEKS UNTUK OTOMASI ICD-10: STUDI KASUS ANAMNESIS PADA REKAM MEDIS ELEKTRONIK. Banda Aceh Fakultas mipa,2026

Ketidaktepatan pengkodean diagnosis icd-10 di fasilitas kesehatan masih menjadi tantangan besar yang berdampak pada pelaporan kesehatan dan klaim asuransi. masalah ini sering disebabkan oleh beban kerja tenaga medis yang tinggi dan dokumentasi anamnesis yang tidak terstruktur. penelitian ini bertujuan untuk membangun model klasifikasi otomatis kodifikasi icd-10 berdasarkan data teks anamnesis menggunakan pendekatan deep learning berbasis konteks, yaitu indobert. data yang digunakan bersumber dari rekam medis rawat jalan rumah sakit ibnu sina aceh besar sebanyak 12.139 data. metodologi penelitian meliputi pra-pemrosesan teks, pembagian data (training, validation, test), dan proses fine-tuning model indobert. eksperimen juga dilakukan dengan menerapkan filter panjang kalimat (7 hingga 40 kata) untuk mengoptimalkan performa model. hasil penelitian menunjukkan bahwa model indobert dengan filter panjang kalimat memberikan performa paling stabil dan akurat dibandingkan model bert standar. model ini berhasil mencapai nilai akurasi dan f1-score di atas 90% pada data pengujian. hal ini menunjukkan bahwa penggunaan arsitektur berbasis transformer yang dilatih pada korpus bahasa indonesia sangat efektif dalam memahami konteks medis lokal. penelitian ini menyimpulkan bahwa otomasi icd-10 menggunakan indobert dapat menjadi solusi praktis dalam meningkatkan akurasi dan efisiensi administrasi rekam medis di rumah sakit.


Baca Juga : APLIKASI SMARTCARD UNTUK SISTEM INFORMASI PUSKESMAS (Sari Rahmawati, 2024)


Abstract

Inaccurate ICD-10 diagnostic coding in healthcare facilities remains a significant challenge, impacting health reporting and insurance claims. This issue is often caused by high medical staff workloads and unstructured anamnesis documentation in free-text narrative form. This study aims to develop an automated ICD-10 classification model based on anamnesis text using a context-based Deep Learning approach, specifically IndoBERT. The dataset used consists of 12,139 outpatient electronic medical records from Ibnu Sina Hospital, Aceh Besar. The research methodology includes text pre-processing, data splitting, and fine-tuning the IndoBERT model, combined with a sentence length filter (7 to 40 words) to optimize performance. The results indicate that the IndoBERT model with a sentence length filter provides the most stable and accurate performance compared to the standard BERT model. This model successfully achieved accuracy and F1-score values exceeding 90% on the test data. This demonstrates that using a transformer-based architecture pre-trained on an Indonesian corpus is highly effective in understanding local medical contexts. The study concludes that ICD-10 automation using IndoBERT can serve as a practical solution to enhance the accuracy and efficiency of medical record administration in hospitals.



    SERVICES DESK