PERBANDINGAN KINERJA METODE KLASIFIKASI MENGGUNAKAN FEATURE SELECTION PADA ANALISIS SENTIMEN SMARTPHONE | ELECTRONIC THESES AND DISSERTATION

Electronic Theses and Dissertation

Universitas Syiah Kuala

    THESES

PERBANDINGAN KINERJA METODE KLASIFIKASI MENGGUNAKAN FEATURE SELECTION PADA ANALISIS SENTIMEN SMARTPHONE


Pengarang

GHIYALTI NOVILIA - Personal Name;

Dosen Pembimbing

Taufik Fuadi Abidin - 197010081994031002 - Dosen Pembimbing I
Ramzi Adriman - 197901302005011001 - Dosen Pembimbing II



Nomor Pokok Mahasiswa

1609200200017

Fakultas & Prodi

Fakultas / / PDDIKTI :

Subject
-
Kata Kunci
-
Penerbit

Banda Aceh : Program Studi Magister Teknik Elektro Unsyiah., 2023

Bahasa

No Classification

-

Literature Searching Service

Hard copy atau foto copy dari buku ini dapat diberikan dengan syarat ketentuan berlaku, jika berminat, silahkan hubungi via telegram (Chat Services LSS)

Penentuan fitur adalah permasalahan utama dalam proses klasifikasi analisis
sentimen. Pemilihan fitur yang tepat dapat mengurangi dimensi dataset, sehingga waktu
yang digunakan untuk tahapan klasifikasi menjadi efisien dan nilai akurasi mengalami
peningkatan. Penelitian ini menggunakan dua metode dalam pembentukan vector
sentimen, pertama menggunakan fitur n-grams yang menghasilkan 6 fitur dan 18 fitur,
kedua menggunakan TF-IDF dan Query Expansion Ranking (QER) yang menghasilkan
vector 10, 20, 30, 40 dan 50 hasil dari perangkingan kata. Nilai f-measure yang dihasilkan
pada 6 fitur menggunakan Naive Bayes adalah 0.73 dan nilai f-measure pada SVM adalah
0.76 sedangkan pada 18 fitur, nilai f-measure Naive Bayes sebesar 0.71 dan pada SVM
sebesar 0.75. Pada kombinasi Naive Bayes dan QER nilai f-measure tertinggi pada
perangkingan 20k sebesar 0.88, serta pada SVM dan QER nilai f-measure sebesar 0.91
untuk semua k. Pada fitur n-grams akurasi SVM pada 6 fitur dan 18 fitur lebih baik
dibandingkan dengan Naive Bayes, Sedangkan pada Query Expansion Ranking (QER)
nilai akurasi tertinggi menggunakan SVM. Hasil dari penelitian ini menunjukkan bahwa
algoritma SVM lebih unggul dibandingkan Naive Bayes dalam analisis sentimen masalah
smartphone. Akurasi meningkat ketika feature selection QER digunakan.

Kata Kunci: Naive Bayes, Support Vector Machine (SVM), Query Expansion Ranking
(QER), F-Measure, Fitur, Vector.

The determination of features is a major problem in the process of classification of sentiment analysis. The selection of the right features can reduce the dimensions of the dataset so that the time used for the classification stage becomes efficient and the accuracy value increases. The study used two methods in sentiment vector formation, first using N-Grams features that produced 6 features and 18 features, and second, using TF-IDF and Query Expansion Ranking (QER), which resulted in vectors of 10, 20, 30, 40, and 50 from word warfare. The f-measure value generated on 6 features using Naive Bayes was 0.73, and the f-measure value on SVM was 0.76. While on 18 features, the f-measure value of Naive Bayes was 0.71 and on SVM was 0.74. In the combination of Naive Bayes and QER, the f-measure value was the highest in the 20k (0.88) and on SVM and QER, the f-measure value was 0.91 for all k. In the n-grams feature, SVM accuracy on 6 features and 18 features was better than Naive Bayes, while QER has the highest accuracy when SVM was used. The results of this study showed that the SVM algorithm was superior to Naive Bayes in the analysis of smartphone problem sentiment. Accuracy increases when QER feature selection is used. Keywords: Naive Bayes, Support Vector Machine (SVM), Query Expansion Ranking (QER), F-Measure, Features, Vector.

Citation



    SERVICES DESK