IMPLEMENTASI SISTEM DETEKSI PLAGIARISME TEKS ABSTRAK MENGGUNAKAN METODE RABIN-KARP DAN MINHASH | ELECTRONIC THESES AND DISSERTATION

Electronic Theses and Dissertation

Universitas Syiah Kuala

    SKRIPSI

IMPLEMENTASI SISTEM DETEKSI PLAGIARISME TEKS ABSTRAK MENGGUNAKAN METODE RABIN-KARP DAN MINHASH


Pengarang

FARIS KHOWARIZMI TARMIZI - Personal Name;

Dosen Pembimbing

Irvanizam - 198103152003121003 - Dosen Pembimbing I
Kurnia Saputra - 198003262014041001 - Dosen Pembimbing I
Muhammad Subianto - 196812111994031005 - Dosen Pembimbing II
Taufik Fuadi Abidin - 197010081994031002 - Penguji
Alim Misbullah - 198806032019031011 - Penguji



Nomor Pokok Mahasiswa

1508107010066

Fakultas & Prodi

Fakultas MIPA / Informatika (S1) / PDDIKTI : 55201

Penerbit

Banda Aceh : Fakultas MIPA (S1)., 2021

Bahasa

Indonesia

No Classification

005.1

Literature Searching Service

Hard copy atau foto copy dari buku ini dapat diberikan dengan syarat ketentuan berlaku, jika berminat, silahkan hubungi via telegram (Chat Services LSS)

Dengan perkembangan teknologi informasi saat ini, plagiarisme menjadi isu yang sering terjadi, yang dapat dicegah dengan menggunakan alat dan layanan pengecekan dokumen teks terhadap plagiarsime. Namun tidak jarang, harga dari layanan pengecekan plagiarisme ini tidak dapat dijangkau oleh banyak pihak terutama pelajar, dan kebijakan privasi terhadap dokumen yang diunggah ke layanan juga perlu dipertanyakan bagi sebagian layanan pengecekan plagiarisme ini. Adapun untuk isu plagiarisme tersebut, dikembangkan metode perbandingan yang dua diantaranya adalah MinHash dan Rabin-Karp. Metode yang digunakan pada penelitian kali ini adalah metode gabungan Rabin-Karp yang telah dieliminasi dengan metode MinHash dan XXHash sebagai algoritma untuk menghitung hash pada tiap bi-gram yang terdapat pada tiap kalimat dalam teks abstrak. Program pendeteksi plagiarisme yang dinamakan dengan “Litracer” ini dibangun berbasis web. Hasil perbandingan menggunakan metode gabungan MinHash dan Rabin-Karp ini mampu mempersingkat waktu perbandingan yang dibutuhkan untuk melakukan perbandingan satu teks abstrak terhadap teks abstrak lainnya yang telah terindeks hingga kurang lebih 40 kali lebih cepat. Metode gabungan MinHash dan Rabin-Karp ini juga mampu mengurangi jumlah kandidat perbandingan akhir dengan metode Rabin-Karp. Disisi lain, dengan berkurangnya jumlah kandidat perbandingan pada perbandingan Rabin-Karp tersebut, maka hasil perbandingan yang sebenarnya memenuhi syarat melewati atau sama dengan batas ambang (threshold) menjadi semakin berkurang. Dampak dari berukrangnya jumlah kesamaan akhir juga mempengaruhi persentase rata-rata. Dengan kelebihan dan kekurangan program untuk mendeteksi plagiarisme “Litracer” yang menggunakan metode gabungan MinHash dan Rabin-Karp ini dapat dikatakan layak digunakan untuk mengetahui kesamaan terhadap teks abstrak secara singkat karena kecepatan proses perbandingannya yang cepat dengan persentase hasil yang bisa diterima.

With the rise of the information age, plagiarism has become a common phenomenon, that could be prevented by using some tools and services, which made to check text documents against plagiarism. But it is not uncommon, the price of plagiarism checking services is often too pricey, especially for students, and questionable privacy policy on documents uploaded to that services is also a consideration for some of these plagiarism checking services. Some comparison methods against plagiarisms are MinHash and Rabin-Karp. The methods used in this study are the combination of the Rabin-Karp methods that eliminated with MinHash and XXHash as hashing calculation methods to each bi-gram found in each sentence in the abstract text. The plagiarism detection program called "Litracer" is built as a web-based application. As result, comparisons using the combined method of Minhash and Rabin-Karp were able to shorten the time needed to do a comparison of abstract text against indexed abstract text by factor up to 40 times. The combined method of Minhash and Rabin-Karp also reduces the number of final comparison candidates with the Rabin-Karp method. On the other hand, the reduced number of comparisons causing reduced results of the actual comparison to meet the requirements of passing or the same as the threshold becomes reduced. The impact of the reduced number of final similarities also affects the average percentage. In conclusion, from the advantages and disadvantages of this program, this program is decent to find similarities of abstract text using this method because of the fast comparison process speed, with acceptable percentages of the result.

Citation



    SERVICES DESK