Pencarian dokumen tertentu yang berada dalam database berukuran besar sangat tidak efisien jika dilakukan secara manual, oleh kerena itu diperlukan sebuah teknik pencarian dokumen melalui suatu sistem temu batik informasi yang dapat dokumen yang relevan dalam waktu singkat. kumpulan dokumen yang dianggap relevan dapat d.iketahui dengan menghitung tingkat kesamaan antara dokumen dengan query yang diberikan. agar kemunculan dari query pada tiap dokumen dapat tersusun lebih rinci maka perlu digunakan algoritma penyusunan kata secara terindeks. pada tugas akhir ini, dilakukan teknik pengindeksan daftar kata-kata yang telah diekstrak nilai kemunculannya yang dibangun menggunakan metode binary search tree (bst). sebelum pengindeksan dilakukan pada data, terlebih dahulu data harus melewati tahap preprocessing, yang salah satunya adalah proses pembersihan data, agar data yang akan diindeks benar-benar kata yang memiliki makna. data yang digunakan pada projek ini adalah kumpulan artikel web wikipedia indonesia yang diunduh pada akhir juni 2008. proses pembersihan data yang dilakukan adalah pembersihan tag-tag html dan karakter-karakter yang tidak di perlukan pada tahap indeksing. hasil menunjukkan bahwa pencarian dokumen menggunakan indeks adalah lebih cepat dibandingkan pencarian dokumen secara manual. kata kunei : dokumen, database, pohon biner, indeks, html, penelusuran informasi, struktur data.
Electronic Theses and Dissertation
Universitas Syiah Kuala
SKRIPSI
PROTOTIPE SISTEM PENGINDEKSIAN DATA TEKS DAN PENELUSURAN INFORMASI (DATA WIKIPEDIA INDONESIA). Banda Aceh Fakultas Teknik,2010
Baca Juga : PROTOTIPE PENGUKURAN PEMAKAIAN ENERGI LISTRIK PADA KAMAR KOST DALAM SATU HUNIAN BERBASIS ARDUINO UNO R3 DAN GSM SHIELD SIM900 (Yulizar, 2017)
Abstract
Baca Juga : KETERBACAAN BUKU TEKS PELAJARAN BAHASA INDONESIA KURIKULUM MERDEKA KELAS VIII SMP MENGGUNAKAN MODEL ANALISIS RAYGOR (Zanuar Rizki, 2023)