Electronic Theses and Dissertation
Universitas Syiah Kuala
NULL
ANALISA PERBANDINGAN TINGKAT KEMIRIPAN DOKUMEN BERDASARKAN METODE VECTOR SPACE MODEL DAN ALIGNMENT SIMILARITY
Pengarang
Zarita Herlin - Personal Name;
Dosen Pembimbing
Nomor Pokok Mahasiswa
1208107010069
Fakultas & Prodi
Fakultas MIPA / Informatika (S1) / PDDIKTI : 55201
Subject
Kata Kunci
Penerbit
Banda Aceh : Universitas Syiah Kuala., 2019
Bahasa
Indonesia
No Classification
-
Literature Searching Service
Hard copy atau foto copy dari buku ini dapat diberikan dengan syarat ketentuan berlaku, jika berminat, silahkan hubungi via telegram (Chat Services LSS)
ABSTRAK
Vector Space Model (VSM) adalah salah satu metode yang dapat menghitung
kemiripan dokumen berdasarkan sudut kosinus antar vektor dokumen yang disebut
cosine similarity. Metode VSM unigram dapat menghitung kemiripan dokumen
dengan baik, namun metode tersebut tidak dapat digunakan untuk membedakan
urutan kata. Dengan menggabungkan metode VSM unigram dengan alignment
similarity dapat menghitung kemiripan dokumen berdasarkan kalimat dengan
mempertimbangkan urutan katanya. Alignment similarity adalah suatu perhitungan
kesamaan posisi kata yang dilakukan dari sisi kiri ke kanan dan dari sisi kanan ke
kiri. Namun pada metode tersebut, kemiripan dokumen akan menghasilkan nilai
persentase yang berbeda jika terdapat penambahan kata pada awal dan akhir, atau
pada tengah kalimat. Maka dari itu, pada penelitian ini perhitungan kemiripan
dokumen berdasarkan kalimatnya dilakukan dengan menggunakan dua metode, yaitu
metode VSM unigram - bigram dan metode VSM unigram - alignment similarity.
Tujuan dilakukannya penelitian ini yaitu membandingkan persentase kemiripan dan
waktu proses yang dihasilkan dari sistem perhitungan kemiripan dokumen
menggunakan kedua metode di atas. Metode penelitian yang dilakukan yaitu dengan
membandingkan 50 dokumen database dengan 11 dokumen uji, dimana 6 dokumen
uji digunakan untuk menganalisa perbedaan persentase kemiripan dokumen, dan 5
dokumen uji lainnya digunakan untuk menganalisa perbedaan waktu proses yang
dibutukan kedua metode di atas untuk menghitung kemiripan dokumen. Hasil yang
didapatkan menunjukkan bahwa metode VSM unigram - bigram lebih efektif dalam
menghitung kemiripan dokumen dengan urutan kata secara global, namun waktu
proses yang dibutuhkan oleh metode tersebut lebih lama dibandingkan dengan
metode VSM unigram - alignment similarity.
Kata kunci : vector space model, cosine similarity, alignment similarity, unigram,
bigram
Tidak Tersedia Deskripsi
PENENTUAN TINGKAT SIMILARITAS DOKUMEN MENGGUNAKAN VECTOR SPACE MODEL UNTUK MEMBANTU PENDETEKSIAN PLAGIARISME (Taufiq M Isa, 2020)
TRANSFORMASI BESARAN TEGANGAN DAN ARUS TIGA FASA MENJADI SPACE VECTOR UNTUK PENGUKURAN DAYA AKTIF DAN REAKTIF (CUT PUTRI MIRNA, 2020)
PENGEMBANGAN MODEL REKOMENDASI PEKERJAAN BERBASIS DEEP LEARNING UNTUK ANALISIS RELEVANSI ANTARA DESKRIPSI PEKERJAAN DAN RESUME KANDIDAT (Devi Anggraini, 2025)
MEMBANGUN SISTEM KLASIFIKASI DOKUMEN WEB MENGGUNAKAN SUPPORT VECTOR MACHINE (SVM) (Alim Misbullah, 2022)
ANALISIS DISTRIBUSI SEDIMEN DASAR DI PERAIRAN PANTAI ULEE LHEUE KOTA BANDA ACEH (Siti Nurhaliza, 2022)