Penentuan fitur adalah permasalahan utama dalam proses klasifikasi analisis sentimen. pemilihan fitur yang tepat dapat mengurangi dimensi dataset, sehingga waktu yang digunakan untuk tahapan klasifikasi menjadi efisien dan nilai akurasi mengalami peningkatan. penelitian ini menggunakan dua metode dalam pembentukan vector sentimen, pertama menggunakan fitur n-grams yang menghasilkan 6 fitur dan 18 fitur, kedua menggunakan tf-idf dan query expansion ranking (qer) yang menghasilkan vector 10, 20, 30, 40 dan 50 hasil dari perangkingan kata. nilai f-measure yang dihasilkan pada 6 fitur menggunakan naive bayes adalah 0.73 dan nilai f-measure pada svm adalah 0.76 sedangkan pada 18 fitur, nilai f-measure naive bayes sebesar 0.71 dan pada svm sebesar 0.75. pada kombinasi naive bayes dan qer nilai f-measure tertinggi pada perangkingan 20k sebesar 0.88, serta pada svm dan qer nilai f-measure sebesar 0.91 untuk semua k. pada fitur n-grams akurasi svm pada 6 fitur dan 18 fitur lebih baik dibandingkan dengan naive bayes, sedangkan pada query expansion ranking (qer) nilai akurasi tertinggi menggunakan svm. hasil dari penelitian ini menunjukkan bahwa algoritma svm lebih unggul dibandingkan naive bayes dalam analisis sentimen masalah smartphone. akurasi meningkat ketika feature selection qer digunakan. kata kunci: naive bayes, support vector machine (svm), query expansion ranking (qer), f-measure, fitur, vector.
Electronic Theses and Dissertation
Universitas Syiah Kuala
THESES
PERBANDINGAN KINERJA METODE KLASIFIKASI MENGGUNAKAN FEATURE SELECTION PADA ANALISIS SENTIMEN SMARTPHONE. Banda Aceh Program Studi Magister Teknik Elektro Unsyiah,2023
Baca Juga : PERBANDINGAN AKURASI HASIL KLASIFIKASI GAMBAR BERWARNA MENGGUNAKAN METODERNK-NEAREST NEIGHBOR (KNN) DAN SUPPORT VECTOR MACHINE (SVM) (Laina Farsiah, 2021)
Abstract
The determination of features is a major problem in the process of classification of sentiment analysis. The selection of the right features can reduce the dimensions of the dataset so that the time used for the classification stage becomes efficient and the accuracy value increases. The study used two methods in sentiment vector formation, first using N-Grams features that produced 6 features and 18 features, and second, using TF-IDF and Query Expansion Ranking (QER), which resulted in vectors of 10, 20, 30, 40, and 50 from word warfare. The f-measure value generated on 6 features using Naive Bayes was 0.73, and the f-measure value on SVM was 0.76. While on 18 features, the f-measure value of Naive Bayes was 0.71 and on SVM was 0.74. In the combination of Naive Bayes and QER, the f-measure value was the highest in the 20k (0.88) and on SVM and QER, the f-measure value was 0.91 for all k. In the n-grams feature, SVM accuracy on 6 features and 18 features was better than Naive Bayes, while QER has the highest accuracy when SVM was used. The results of this study showed that the SVM algorithm was superior to Naive Bayes in the analysis of smartphone problem sentiment. Accuracy increases when QER feature selection is used. Keywords: Naive Bayes, Support Vector Machine (SVM), Query Expansion Ranking (QER), F-Measure, Features, Vector.
Baca Juga : PENGGUNAAN METODE SUPPORT VECTOR MACHINE (SVM) DALAM PENGKLASIFIKASIAN DATA STATUS GIZI (Ervina Yunita, 2022)