Electronic Theses and Dissertation
Universitas Syiah Kuala
SKRIPSI
IMPLEMENTASI DAN EVALUASI RETRIEVAL-AUGMENTEDRNGENERATION UNTUK PERTANYAAN MULTI-HOP BERBASISRNBERITA BAHASA INDONESIA
Pengarang
Muhammad Ilhaam Ghiffari - Personal Name;
Dosen Pembimbing
Razief Perucha Fauzie Afidh - 198408062012121002 - Dosen Pembimbing I
Kikye Martiwi Sukiakhy - 198605202019032009 - Dosen Pembimbing II
Nomor Pokok Mahasiswa
2108107010005
Fakultas & Prodi
Fakultas MIPA / Informatika (S1) / PDDIKTI : 55201
Subject
Kata Kunci
Penerbit
Banda Aceh : Fakultas MIPA Informatika., 2026
Bahasa
No Classification
-
Literature Searching Service
Hard copy atau foto copy dari buku ini dapat diberikan dengan syarat ketentuan berlaku, jika berminat, silahkan hubungi via telegram (Chat Services LSS)
Perkembangan teknologi Large Language Model (LLM) telah membuka peluang baru
dalam pengembangan sistem tanya jawab otomatis. Namun, LLM memiliki keterbatasan
dalam mengakses informasi terkini dan konteks spesifik. Penelitian ini mengembangkan
sistem Retrieval-Augmented Generation (RAG) untuk menjawab pertanyaan multi-hop
berbahasa Indonesia pada domain berita. Sistem ini mengintegrasikan komponen
retrieval (pencarian dokumen) dan generation (pembangkitan jawaban) untuk menjawab
pertanyaan kompleks yang membutuhkan informasi dari beberapa dokumen. Korpus
berita dikumpulkan dari portal Detik.com meliputi tiga kategori: ekonomi-keuangan
(detikFinance), otomotif (detikOto), dan olahraga (detikSport) dengan total 900 artikel.
Sistem menggunakan embedding BGE-M3 untuk representasi semantik, ChromaDB
sebagai penyimpan vektor, dan model LLM Qwen3 30B A3B serta Gemma 3 27B untuk
pembangkitan jawaban. Evaluasi dilakukan menggunakan 90 pertanyaan multi-hop
dengan tiga tipe: bridging, temporal, dan comparison. Metode retrieval yang diuji
meliputi Dense Retrieval (semantik), Sparse Retrieval (BM25), Hybrid, dan Hybrid
dengan Reranking. Hasil evaluasi menunjukkan kombinasi Qwen3 30B A3B dengan
Dense Retrieval memberikan kinerja optimal dengan Soft Exact Match 85,56%, Token
F1 56,85%, ROUGE-L 51,90%, METEOR 51,83%, dan Document Recall 69,44%.
Metode Dense Retrieval mencapai Hit@5 sebesar 85,19%, menunjukkan sistem berhasil
menemukan dokumen relevan di lima hasil teratas untuk sebagian besar pertanyaan.
Penelitian ini membuktikan bahwa sistem RAG efektif untuk menjawab pertanyaan
multi-hop berbahasa Indonesia pada domain berita.
Kata kunci: Retrieval-Augmented Generation, RAG, pertanyaan multi-hop, tanya
jawab berbasis dokumen, berita berbahasa Indonesia, Large Language Model, dense
retrieval, embedding BGE-M3
The advancement of Large Language Model (LLM) technology has opened new opportunities in developing automated question-answering systems. However, LLMs have limitations in accessing up-to-date and context-specific information. This research develops a Retrieval-Augmented Generation (RAG) system for answering multi-hop questions in Indonesian within the news domain. The system integrates retrieval and generation components to answer complex questions requiring information from multiple documents. The news corpus was collected from the Detik.com portal, covering three categories: economy-finance (detikFinance), automotive (detikOto), and sports (detikSport), totaling 900 articles. The system utilizes BGE-M3 embeddings for semantic representation, ChromaDB as the vector store, and Qwen3 30B A3B and Gemma 3 27B LLM models for answer generation. Evaluation was conducted using 90 multi-hop questions with three types: bridging, temporal, and comparison. The retrieval methods tested include Dense Retrieval (semantic), Sparse Retrieval (BM25), Hybrid, and Hybrid with Reranking. The evaluation results show that the combination of Qwen3 30B A3B with Dense Retrieval achieves optimal performance with Soft Exact Match of 85.56%, Token F1 of 56.85%, ROUGE-L of 51.90%, METEOR of 51.83%, and Document Recall of 69.44%. The Dense Retrieval method achieves Hit@5 of 85.19%, indicating the system successfully retrieves relevant documents in the top five results for most queries. This research demonstrates that RAG systems are effective for answering multi-hop questions in Indonesian within the news domain. Keywords: Retrieval-Augmented Generation, RAG, multi-hop question answering, document-based question answering, Indonesian news, Large Language Model, dense retrieval, BGE-M3 embedding
RAGAM PERTANYAAN YANG DIGUNAKAN GURURNDALAM PEMBELAJARAN BAHASA INDONESIA PADA KELAS VIIIRNMTST MA'HAD DAARUF TAHFIZH AL-IKHLAS BANDA ACEH (Pratiwi Rahmadini, 2024)
RAGAM PERTANYAAN YANG DIGUNAKAN GURU DALAM PEMBELAJARAN BAHASA INDONESIA PADA KELAS XI SMA NEGERI 1 INGIN JAYA (SITI MAISARAH, 2019)
ANALISIS BAHASA GURU DALAM PEMBELAJARAN BAHASA INDONESIA DI MTSS LAM UJONG KECAMATAN KRUENG BARONA JAYA KABUPATEN ACEH BESAR (LASMY, 2016)
PENGGUNAAN PERTANYAAN TINGKAT TINGGI OLEH GURU DALAM PEMBELAJARAN DI SMP NEGERI 4 BANDA ACEH (Nurmita, 2018)
ANALISIS BAHASA GURU DALAM PEMBELAJARAN BAHASA INDONESIA DI KELAS VIII MTSN II BANDA ACEH (Sinti Hiyari, 2020)