Peningkatan jumlah halaman web cukup signifikan belakangan ini membuat proses pengklasifikasian halaman web menjadi semakin penting. kamus (tesaurus) dalam pengklasifikasian halaman web adalah salah satu cara untuk meningkatkan akurasi. tesaurus yang selama ini digunakan adalah tesaurus statis yang hanya dibangun sekali sehingga diperlukan algoritma dan analisis dalam pembaruan tesaurus. algoritma yang dilakukan adalah mengunduh halaman web, membersihkan halaman web, membuat fitur, mengklasifikasi dengan svm (support vector machine), melakukan tokenisasi hasil klasifikasi halaman web, memperbarui tesaurus, dan menganalisis tesaurus. dalam percobaan ini, pembaruan tesaurus dilakukan dengan 2 tahap. tahap pertama pembaruan tesaurus dengan 10000 halaman web membutuhkan waktu 2 detik dan terjadi sedikit penurunan nilai precision, recall dan f-measure. tahap kedua pembaruan tesaurus juga dilakukan dengan 10000 halaman web membutuhkan waktu 3 detik dan kembali terjadi sedikit penurunan nilai precision, recall dan f-measure. selanjutnya, dilakukan analisis dengan eliminasi rasio dan eliminasi frekuensi terkecil. pembaruan tahap pertama dan kedua dengan eliminasi rasio meningkatkan nilai akurasi, namun tidak signifikan, sedangkan penggabungan eliminasi rasio dan eliminasi frekuensi terkecil mengakibatkan nilai precision dan f-measure meningkat secara signifikan, walau nilai recall sedikit menurun, namun tidak terlalu berpengaruh terhadap hasil klasifikasi.
Electronic Theses and Dissertation
Universitas Syiah Kuala
SKRIPSI
ANALISA PEMBARUAN KAMUS SECARA OTOMATIS DALAM PENGKATEGORIAN HALAMAN WEB PENYAKIT TROPIS. Banda Aceh Fakultas Matematika dan Ilmu Pengetahuan Alam,2014
Baca Juga : PENGARUH E-COMMERCE DAN TEKNOLOGI INFORMASI TERHADAP KUALITAS SISTEM INFORMASI AKUNTANSI (STUDI EMPIRIS PADA INDUSTRI PERHOTELAN DI KOTA BANDA ACEH DAN SEKITARNYA) (MUHAMMAD ZAKWAN, 2021)
Abstract
Baca Juga : PENGARUH PENERAPAN SISTEM INFORMASI AKUNTANSI TERHADAP KINERJA KARYAWAN BRI CABANG BANDA ACEH (DICO WIRANTO, 2019)