Abstrak vector space model (vsm) adalah salah satu metode yang dapat menghitung kemiripan dokumen berdasarkan sudut kosinus antar vektor dokumen yang disebut cosine similarity. metode vsm unigram dapat menghitung kemiripan dokumen dengan baik, namun metode tersebut tidak dapat digunakan untuk membedakan urutan kata. dengan menggabungkan metode vsm unigram dengan alignment similarity dapat menghitung kemiripan dokumen berdasarkan kalimat dengan mempertimbangkan urutan katanya. alignment similarity adalah suatu perhitungan kesamaan posisi kata yang dilakukan dari sisi kiri ke kanan dan dari sisi kanan ke kiri. namun pada metode tersebut, kemiripan dokumen akan menghasilkan nilai persentase yang berbeda jika terdapat penambahan kata pada awal dan akhir, atau pada tengah kalimat. maka dari itu, pada penelitian ini perhitungan kemiripan dokumen berdasarkan kalimatnya dilakukan dengan menggunakan dua metode, yaitu metode vsm unigram - bigram dan metode vsm unigram - alignment similarity. tujuan dilakukannya penelitian ini yaitu membandingkan persentase kemiripan dan waktu proses yang dihasilkan dari sistem perhitungan kemiripan dokumen menggunakan kedua metode di atas. metode penelitian yang dilakukan yaitu dengan membandingkan 50 dokumen database dengan 11 dokumen uji, dimana 6 dokumen uji digunakan untuk menganalisa perbedaan persentase kemiripan dokumen, dan 5 dokumen uji lainnya digunakan untuk menganalisa perbedaan waktu proses yang dibutukan kedua metode di atas untuk menghitung kemiripan dokumen. hasil yang didapatkan menunjukkan bahwa metode vsm unigram - bigram lebih efektif dalam menghitung kemiripan dokumen dengan urutan kata secara global, namun waktu proses yang dibutuhkan oleh metode tersebut lebih lama dibandingkan dengan metode vsm unigram - alignment similarity. kata kunci : vector space model, cosine similarity, alignment similarity, unigram, bigram
Electronic Theses and Dissertation
Universitas Syiah Kuala
NULL
ANALISA PERBANDINGAN TINGKAT KEMIRIPAN DOKUMEN BERDASARKAN METODE VECTOR SPACE MODEL DAN ALIGNMENT SIMILARITY. Banda Aceh Universitas Syiah Kuala,2019
Baca Juga : PENGEMBANGAN MODEL REKOMENDASI PEKERJAAN BERBASIS DEEP LEARNING UNTUK ANALISIS RELEVANSI ANTARA DESKRIPSI PEKERJAAN DAN RESUME KANDIDAT (Devi Anggraini, 2025)
Abstract
Baca Juga : PERBANDINGAN SAMPEL SEDIMEN DASAR LAUT MENGGUNAKAN METODE CORING DAN PONAR GRAB DI PERAIRAN ULEE LHEUE DAN PERAIRAN PULAU ACEH (AQIL SABRAN, 2022)