ANALISA PERBANDINGAN TINGKAT KEMIRIPAN DOKUMEN BERDASARKAN METODE VECTOR SPACE MODEL DAN ALIGNMENT SIMILARITY | ELECTRONIC THESES AND DISSERTATION

Electronic Theses and Dissertation

Universitas Syiah Kuala

    NULL

ANALISA PERBANDINGAN TINGKAT KEMIRIPAN DOKUMEN BERDASARKAN METODE VECTOR SPACE MODEL DAN ALIGNMENT SIMILARITY


Pengarang

Zarita Herlin - Personal Name;

Dosen Pembimbing



Nomor Pokok Mahasiswa

1208107010069

Fakultas & Prodi

Fakultas MIPA / Informatika (S1) / PDDIKTI : 55201

Subject
-
Kata Kunci
-
Penerbit

Banda Aceh : Universitas Syiah Kuala., 2019

Bahasa

Indonesia

No Classification

-

Literature Searching Service

Hard copy atau foto copy dari buku ini dapat diberikan dengan syarat ketentuan berlaku, jika berminat, silahkan hubungi via telegram (Chat Services LSS)

ABSTRAK
Vector Space Model (VSM) adalah salah satu metode yang dapat menghitung
kemiripan dokumen berdasarkan sudut kosinus antar vektor dokumen yang disebut
cosine similarity. Metode VSM unigram dapat menghitung kemiripan dokumen
dengan baik, namun metode tersebut tidak dapat digunakan untuk membedakan
urutan kata. Dengan menggabungkan metode VSM unigram dengan alignment
similarity dapat menghitung kemiripan dokumen berdasarkan kalimat dengan
mempertimbangkan urutan katanya. Alignment similarity adalah suatu perhitungan
kesamaan posisi kata yang dilakukan dari sisi kiri ke kanan dan dari sisi kanan ke
kiri. Namun pada metode tersebut, kemiripan dokumen akan menghasilkan nilai
persentase yang berbeda jika terdapat penambahan kata pada awal dan akhir, atau
pada tengah kalimat. Maka dari itu, pada penelitian ini perhitungan kemiripan
dokumen berdasarkan kalimatnya dilakukan dengan menggunakan dua metode, yaitu
metode VSM unigram - bigram dan metode VSM unigram - alignment similarity.
Tujuan dilakukannya penelitian ini yaitu membandingkan persentase kemiripan dan
waktu proses yang dihasilkan dari sistem perhitungan kemiripan dokumen
menggunakan kedua metode di atas. Metode penelitian yang dilakukan yaitu dengan
membandingkan 50 dokumen database dengan 11 dokumen uji, dimana 6 dokumen
uji digunakan untuk menganalisa perbedaan persentase kemiripan dokumen, dan 5
dokumen uji lainnya digunakan untuk menganalisa perbedaan waktu proses yang
dibutukan kedua metode di atas untuk menghitung kemiripan dokumen. Hasil yang
didapatkan menunjukkan bahwa metode VSM unigram - bigram lebih efektif dalam
menghitung kemiripan dokumen dengan urutan kata secara global, namun waktu
proses yang dibutuhkan oleh metode tersebut lebih lama dibandingkan dengan
metode VSM unigram - alignment similarity.
Kata kunci : vector space model, cosine similarity, alignment similarity, unigram,
bigram

Tidak Tersedia Deskripsi

Citation



    SERVICES DESK