PROTOTIPE SISTEM PENGINDEKSIAN DATA TEKS DAN PENELUSURAN INFORMASI (DATA WIKIPEDIA INDONESIA) | ELECTRONIC THESES AND DISSERTATION

Electronic Theses and Dissertation

Universitas Syiah Kuala

    SKRIPSI

PROTOTIPE SISTEM PENGINDEKSIAN DATA TEKS DAN PENELUSURAN INFORMASI (DATA WIKIPEDIA INDONESIA)


Pengarang

Khairul Umam - Personal Name;

Dosen Pembimbing



Nomor Pokok Mahasiswa

0304105010034

Fakultas & Prodi

Fakultas Teknik / Teknik Elektro (S1) / PDDIKTI : 20201

Subject
-
Kata Kunci
-
Penerbit

Banda Aceh : Fakultas Teknik., 2010

Bahasa

No Classification

-

Literature Searching Service

Hard copy atau foto copy dari buku ini dapat diberikan dengan syarat ketentuan berlaku, jika berminat, silahkan hubungi via telegram (Chat Services LSS)

Pencarian dokumen tertentu yang berada dalam database berukuran besar sangat tidak efisien jika dilakukan secara manual, oleh kerena itu diperlukan sebuah teknik pencarian dokumen melalui suatu sistem temu batik informasi yang dapat dokumen yang relevan dalam waktu singkat. Kumpulan dokumen yang dianggap relevan dapat d.iketahui dengan menghitung tingkat kesamaan antara dokumen dengan query yang diberikan. Agar kemunculan dari query pada tiap dokumen dapat tersusun lebih rinci maka perlu digunakan algoritma penyusunan kata secara terindeks. Pada tugas akhir ini, dilakukan teknik pengindeksan daftar kata-kata yang telah diekstrak nilai kemunculannya yang dibangun menggunakan metode Binary Search Tree (BST). Sebelum pengindeksan dilakukan pada data, terlebih dahulu data harus melewati tahap preprocessing, yang salah satunya adalah proses pembersihan data, agar data yang akan diindeks benar-benar kata yang memiliki makna. Data yang digunakan pada projek ini adalah kumpulan artikel web Wikipedia Indonesia yang diunduh pada akhir Juni 2008. Proses pembersihan data yang dilakukan adalah pembersihan tag-tag HTML dan karakter-karakter yang tidak di perlukan pada tahap indeksing. Hasil menunjukkan bahwa pencarian dokumen menggunakan indeks adalah lebih cepat dibandingkan pencarian dokumen secara manual.


Kata Kunei : Dokumen, database, pohon biner, indeks, HTML, penelusuran informasi, struktur data.

Tidak Tersedia Deskripsi

Citation



    SERVICES DESK