KLASIFIKASI PERTANYAAN KONSULTASI KESEHATAN ONLINE MENGGUNAKAN INDOBERT DAN WORD EMBEDDING FASTTEXT SEBAGAI VEKTOR INPUT PADA ARSITEKTUR BILSTM | ELECTRONIC THESES AND DISSERTATION

Electronic Theses and Dissertation

Universitas Syiah Kuala

    SKRIPSI

KLASIFIKASI PERTANYAAN KONSULTASI KESEHATAN ONLINE MENGGUNAKAN INDOBERT DAN WORD EMBEDDING FASTTEXT SEBAGAI VEKTOR INPUT PADA ARSITEKTUR BILSTM


Pengarang

RAUDINA LUTHFIANI - Personal Name;

Dosen Pembimbing

Taufik Fuadi Abidin - 197010081994031002 - Dosen Pembimbing I
Nazaruddin - 197202061997021001 - Dosen Pembimbing II



Nomor Pokok Mahasiswa

1708107010030

Fakultas & Prodi

Fakultas MIPA / Informatika (S1) / PDDIKTI : 55201

Subject
-
Kata Kunci
-
Penerbit

Banda Aceh : Fakultas MIPA (S1)., 2024

Bahasa

No Classification

-

Literature Searching Service

Hard copy atau foto copy dari buku ini dapat diberikan dengan syarat ketentuan berlaku, jika berminat, silahkan hubungi via telegram (Chat Services LSS)

Internet telah menjadi media komunikasi utama untuk mengakses informasi atau berita yang digunakan oleh banyak orang saat ini. Salah satu informasi yang banyak diakses oleh pengguna internet adalah informasi terkait kesehatan. Kemudahan akses untuk mendapatkan informasi kesehatan mendorong pengguna internet untuk memilih mengandalkan informasi kesehatan yang ada di internet sebelum mencari bantuan medis ketika terdapat kekhawatiran terhadap kondisi kesehatan mereka. Di tambah lagi, perkembangan Teknologi Informasi Komunikasi (TIK) secara pesat membuat pelayanan kesehatan secara jarak jauh semakin mungkin dilakukan sehingga meningkatkan efisiensi dan memperluas akses layanan kesehatan kepada masyarakat. Salah satu layanan kesehatan jarak jauh yang mengalami peningkatan penggunaan bagi masyarakat saat ini adalah layanan konsultasi kesehatan dengan tenaga medis dalam bentuk forum online yang tersedia di situs web kesehatan. Namun, layanan konsultasi kesehatan online yang ada umumnya menggunakan annotator manual untuk mengelompokkan pertanyaan pengguna ke dalam subtopik yang sesuai dengan spesialisasi medis sehingga membutuhkan waktu untuk pertanyaan sampai kepada dokter spesialis atau tenaga medis yang berkeahlian khusus untuk menangani pertanyaan tersebut. Akibatnya, pengguna membutuhkan waktu yang tidak sebentar untuk menerima jawaban dari pertanyaan konsultasi mereka, apalagi jika pertanyaan yang masuk ke dalam forum layanan tersebut tidak sedikit. Oleh karena itu, pengklasifikasian pertanyaan konsultasi kesehatan secara otomatis dapat membantu meningkatkan efisiensi waktu untuk pertanyaan sampai kepada tenaga medis dan jawaban dari pertanyaan tersebut sampai kepada pengguna. Penelitian ini melakukan klasifikasi pertanyaan pengguna konsultasi kesehatan menggunakan model berbasis deep learning, yaitu arsitektur BiLSTM. Penelitian ini menguji dua pendekatan representasi kata, yaitu word embedding fastText dan contextual embedding IndoBERT sebagai vektor input BiLSTM untuk menentukan pendekatan mana yang berkinerja tinggi dalam hal pembelajaran untuk tugas klasifikasi teks pertanyaan dalam domain kesehatan. Pada pelatihan model, penelitian ini menggunakan tiga skenario untuk penetapan nilai learning rate, yaitu 0.001, 0.0001, dan 0.00001 dan dua skenario batch size, yaitu 16 dan 32. Hasil penelitian menunjukkan bahwa model IndoBERT+BiLSTM mencapai kinerja tertinggi dengan akurasi dan F1 score masing-masing sebesar, 90.67% dan 90.71% dengan parameter terbaik untuk kedua model adalah learning rate 0.001 dan batch size 32.

The Internet has become the primary media for many people to access information and news. Health-related information is one of the most frequently accessed types of content by internet users. The ease of access to health information encourages individuals to rely on it before seeking medical help when they have health concerns. Furthermore, the rapid development of Information and Communication Technology (ICT) has made telemedicine increasingly feasible, enhancing efficiency and broadening access to healthcare services. One telemedicine service that has seen increased usage is online health consultations with medical professionals through forums available on health websites. However, existing online health consultation services typically use manual annotators to categorize user questions into subtopics corresponding to medical specialties, causing delays in routing questions to the appropriate specialists. Consequently, users may experience significant wait times for responses, especially when the volume of questions is high. Therefore, automating the classification of health consultation questions can improve the efficiency of directing questions to medical professionals and reduce response times. This study employs a deep learning-based model, specifically the BiLSTM architecture, to classify user health consultation questions. We investigate two-word representation approaches—fastText word embeddings and IndoBERT contextual embeddings—as input vectors for the BiLSTM to determine which approach yields higher performance for text classification in the health domain. The training explores three learning rate scenarios (0.001, 0.0001, and 0.00001) and two batch size scenarios (16 and 32). The results indicate that the IndoBERT+BiLSTM model achieves the highest performance with an accuracy and F1 score of 90.67% and 90.71%, respectively. The optimal parameters for both models are a learning rate of 0.001 and a batch size of 32.

Citation



    SERVICES DESK