Universitas Syiah Kuala | ELECTRONIC THESES AND DISSERTATION

Pencarian dokumen tertentu yang berada dalam database berukuran besar sangat tidak efisien jika dilakukan secara manual, oleh kerena itu diperlukan sebuah teknik pencarian dokumen melalui suatu sistem temu batik informasi yang dapat dokumen yang relevan dalam waktu singkat. kumpulan dokumen yang dianggap relevan dapat d.iketahui dengan menghitung tingkat kesamaan antara dokumen dengan query yang diberikan. agar kemunculan dari query pada tiap dokumen dapat tersusun lebih rinci maka perlu digunakan algoritma penyusunan kata secara terindeks. pada tugas akhir ini, dilakukan teknik pengindeksan daftar kata-kata yang telah diekstrak nilai kemunculannya yang dibangun menggunakan metode binary search tree (bst). sebelum pengindeksan dilakukan pada data, terlebih dahulu data harus melewati tahap preprocessing, yang salah satunya adalah proses pembersihan data, agar data yang akan diindeks benar-benar kata yang memiliki makna. data yang digunakan pada projek ini adalah kumpulan artikel web wikipedia indonesia yang diunduh pada akhir juni 2008. proses pembersihan data yang dilakukan adalah pembersihan tag-tag html dan karakter-karakter yang tidak di perlukan pada tahap indeksing. hasil menunjukkan bahwa pencarian dokumen menggunakan indeks adalah lebih cepat dibandingkan pencarian dokumen secara manual. kata kunei : dokumen, database, pohon biner, indeks, html, penelusuran informasi, struktur data.

Electronic Theses and Dissertation

Detail Abstract

SKRIPSI

Khairul Umam, PROTOTIPE SISTEM PENGINDEKSIAN DATA TEKS DAN PENELUSURAN INFORMASI (DATA WIKIPEDIA INDONESIA). Banda Aceh Fakultas Teknik,2010

Abstract