ANALISA PEMBARUAN KAMUS SECARA OTOMATIS DALAM PENGKATEGORIAN HALAMAN WEB PENYAKIT TROPIS | ELECTRONIC THESES AND DISSERTATION

Electronic Theses and Dissertation

Universitas Syiah Kuala

    SKRIPSI

ANALISA PEMBARUAN KAMUS SECARA OTOMATIS DALAM PENGKATEGORIAN HALAMAN WEB PENYAKIT TROPIS


Pengarang

Ulfa Nadia - Personal Name;

Dosen Pembimbing



Nomor Pokok Mahasiswa

1008107020007

Fakultas & Prodi

Fakultas / / PDDIKTI :

Kata Kunci
Penerbit

Banda Aceh : Fakultas Matematika dan Ilmu Pengetahuan Alam., 2014

Bahasa

Indonesia

No Classification

025.04

Literature Searching Service

Hard copy atau foto copy dari buku ini dapat diberikan dengan syarat ketentuan berlaku, jika berminat, silahkan hubungi via telegram (Chat Services LSS)

Peningkatan jumlah halaman web cukup signifikan belakangan ini membuat proses pengklasifikasian halaman web menjadi semakin penting. Kamus (tesaurus) dalam pengklasifikasian halaman web adalah salah satu cara untuk meningkatkan akurasi. Tesaurus yang selama ini digunakan adalah tesaurus statis yang hanya dibangun sekali sehingga diperlukan algoritma dan analisis dalam pembaruan tesaurus. Algoritma yang dilakukan adalah mengunduh halaman web, membersihkan halaman web, membuat fitur, mengklasifikasi dengan SVM (Support Vector Machine), melakukan tokenisasi hasil klasifikasi halaman web, memperbarui tesaurus, dan menganalisis tesaurus. Dalam percobaan ini, pembaruan tesaurus dilakukan dengan 2 tahap. Tahap pertama pembaruan tesaurus dengan 10000 halaman web membutuhkan waktu 2 detik dan terjadi sedikit penurunan nilai precision, recall dan f-measure. Tahap kedua pembaruan tesaurus juga dilakukan dengan 10000 halaman web membutuhkan waktu 3 detik dan kembali terjadi sedikit penurunan nilai precision, recall dan f-measure. Selanjutnya, dilakukan analisis dengan eliminasi rasio dan eliminasi frekuensi terkecil. Pembaruan tahap pertama dan kedua dengan eliminasi rasio meningkatkan nilai akurasi, namun tidak signifikan, sedangkan penggabungan eliminasi rasio dan eliminasi frekuensi terkecil mengakibatkan nilai precision dan f-measure meningkat secara signifikan, walau nilai recall sedikit menurun, namun tidak terlalu berpengaruh terhadap hasil klasifikasi.

Tidak Tersedia Deskripsi

Citation



    SERVICES DESK