Algoritma stripping lookup (sl) stemmer merupakan salah satu algoritma stemming bahasa indonesia. algoritma sl stemmer telah dilaporkan memiliki akurasi lebih dari 97% pada setiap jenis pemenggalan imbuhannya, namun algoritma ini belum pernah diuji terhadap algoritma stemming yang lain. pada penelitian ini, algoritma sl stemmer dibandingkan dengan algoritma yang sudah teruji memiliki akurasi yang sangat baik, yaitu enhanced confix stripping (ecs) stemmer, confix stripping (cs) stemmer, dan nazief & adriani. pengujian ini dilakukan terhadap kata unik yang berjumlah 12.458 kata. selain itu, pengujian kecepatan penggunaan library ekspresi reguler eksternal c++ juga dilakukan pada algoritma stemming bahasa indonesia. library yang menjadi bahan uji pada penelitian ini adalah boost.regex, pcre, dan re2. pengujian kecepatan dilakukan dengan dua pendekatan, yaitu penggunaan regex prakompilasi dan penggunaan regex nonprakompilasi. hasil penelitian menunjukkan bahwa algoritma stemming terbaik adalah algoritma ecs stemmer sementara algoritma sl stemmer dengan semua jenis pemenggalan imbuhannya berada pada urutan kedua. adapun peringkat akurasi algoritma stemming bahasa indonesia yang diuji, dari tertinggi hingga terendah, adalah ecs stemmer (97%), sl stemmer (96% pada sl stemmer dengan jenis pemenggalan 2 model b), cs stemmer (95,8%), dan nazief & adriani (93,7%). algoritma ecs stemmer digunakan untuk pengujian kecepatan library ekspresi reguler eksternal. hasil pengujian menunjukkan bahwa pendekatan penggunaan regex prakompilasi jauh lebih baik digunakan dibandingkan penggunaan regex nonprakompilasi. adapun penggunaan library yang direkomendasikan dengan penggunaan regex prakompilasi, dari urutan tercepat, adalah re2, pcre, dan boost.regex. meskipun demikian, kecepatan library pcre dan boost.regex juga dapat ditoleransi untuk penggunaan algoritma stemming karena waktu yang dibutuhkan tidak terlalu jauh berbeda dengan penggunaan library re2. hasil tersebut didapatkan karena pola ekspresi reguler yang dibuat tidak menyebabkan masalah performa yang disebabkan oleh proses backtracking pada library ekspresi reguler yang menerapkan proses backtracking, yaitu boost.regex dan pcre.
Electronic Theses and Dissertation
Universitas Syiah Kuala
SKRIPSI
PERBANDINGAN AKURASI DAN PENERAPAN LIBRARY EKSPRESI REGULER EKSTERNAL C++ PADA ALGORITMA STEMMING BAHASA INDONESIA. Banda Aceh FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SYIAH KUALA,2016
Baca Juga : PENGOPTIMALAN MASALAH NONLINIER DALAM MEMINIMUMKAN BIAYA PRODUKSI MENGGUNAKAN SEPARABLE PROGRAMMING DAN ALGORITMA GENETIKA (NANDA FAZILAH, 2023)
Abstract
Baca Juga : ANALISIS SENTIMEN PADA REVIEW HOTEL DENGAN TEKS BAHASA INDONESIA MENGGUNAKAN MACHINE LEARNING (NURHAFNITA, 2023)