ANALISIS SENTIMEN PADA REVIEW HOTEL DENGAN TEKS BAHASA INDONESIA MENGGUNAKAN MACHINE LEARNING | ELECTRONIC THESES AND DISSERTATION

Electronic Theses and Dissertation

Universitas Syiah Kuala

    THESES

ANALISIS SENTIMEN PADA REVIEW HOTEL DENGAN TEKS BAHASA INDONESIA MENGGUNAKAN MACHINE LEARNING


Pengarang

NURHAFNITA - Personal Name;

Dosen Pembimbing

Taufik Fuadi Abidin - 197010081994031002 - Dosen Pembimbing I
Ramzi Adriman - 197901302005011001 - Dosen Pembimbing II



Nomor Pokok Mahasiswa

1609200200012

Fakultas & Prodi

Fakultas / / PDDIKTI :

Penerbit

Banda Aceh : Program Studi Magister Teknik Elektro., 2023

Bahasa

Indonesia

No Classification

005.1

Literature Searching Service

Hard copy atau foto copy dari buku ini dapat diberikan dengan syarat ketentuan berlaku, jika berminat, silahkan hubungi via telegram (Chat Services LSS)

Teknis Naïve Bayes masih memiliki kelemahan dalam tingkat akurasi, oleh karena itu penting melakukan optimalisasi. Optimalisasi menggunakan teknik yang tepat dan terbaik untuk pengelompokan teks, khususnya klasifikasi review hotel, sehingga tampak tingkat akurasi yang lebih unggul. Pada penelitian ini membandingkan penggunaan dataset dengan 6 fitur dan dataset 18 fitur untuk melihat pengaruhnya terhadap akurasi klasifikasi dari Naïve Bayes dengan Chi-square selaku teknik feature selection dalam mengklasifikasikan review dari suatu komentar untuk meningkatkan akurasi analisa sentimen. Hal ini dapat dilihat ketika algoritma Naïve Bayesian diterapkan pada dataset dengan jumlah fitur 18, dengan nilai akurasi f-measure = 0.83 dan ROC= 0,922 dibandingkan dengan 6 fitur yaitu f-measure = 0,746 dan ROC = 0,839. Penggunaan feature selection Chi Square memiliki pengaruh untuk meningkatkan akurasi algoritma Naïve Bayes dalam klasifikasi teks review hotel berbahasa Indonesia. Berdasarkan nilai f-measure dan ROC, nilai akurasi akan tinggi apabila algoritma Naïve Bayes dipadu dengan feature selection Chi Square saat diterapkan pada dataset dengan jumlah fitur 18, yaitu f-measure = 0.831 dan ROC = 0.92. Dari pengkajian yang dilakukan ini dapat tetapkan bahwa algoritma Naïve Bayes dikombinasikan dengan Chi Square dapat meningkatkan nilai akurasi, baik pada dataset 6 fitur maupun dataset 18 fitur.

Kata Kunci : Naive bayes, Chi Square, Feature Selection.

The Naïve Bayes method still has weaknesses in the level of accuracy obtained, therefore it is important to optimize it. Optimization uses the right and best techniques for text grouping, especially hotel review classification, so that a higher level of accuracy appears. This study compares the use of a dataset with 6 features and a dataset of 18 features to see its effect on the classification accuracy of Naïve Bayes with Chi-square as a feature selection technique in classifying a review of a comment to improve the accuracy of sentiment analysis. This can be seen when the Naïve Bayesian algorithm is applied to a dataset with 18 features, with an accuracy value of f-measure = 0.83 and ROC = 0.922 compared to 6 features, namely f-measure = 0.746 and ROC = 0.839. The use of Chi Square feature selection has the effect of increasing the accuracy of the Naïve Bayes algorithm in the classification of hotel review texts in Indonesian. Based on the f-measure and ROC values, the use of the Naïve Bayes algorithm combined with Chi Square feature selection has a high accuracy value when applied to a dataset with 18 features, namely f-measure = 0.831 and ROC = 0.92. From this research, it can be concluded that the Naïve Bayes algorithm combined with Chi Square feature selection can increase the accuracy value, both in the 6-feature dataset and the 18-feature dataset. Kata Kunci : Naive bayes, Chi Square, Feature Selection.

Citation



    SERVICES DESK