KLASIFIKASI DEPRESI DARI PESAN TEKS MELALUI SENTIMEN PENGGUNA DI TWITTER MENGGUNAKAN METODE NAïVE BAYES | ELECTRONIC THESES AND DISSERTATION

Electronic Theses and Dissertation

Universitas Syiah Kuala

    SKRIPSI

KLASIFIKASI DEPRESI DARI PESAN TEKS MELALUI SENTIMEN PENGGUNA DI TWITTER MENGGUNAKAN METODE NAïVE BAYES


Pengarang

Wika Meilany Syam Bahri - Personal Name;

Dosen Pembimbing

Yudha Nurdin - 197910012010121002 - Dosen Pembimbing I
Khairun Saddami - 199103182020071101 - Dosen Pembimbing II



Nomor Pokok Mahasiswa

1804111010003

Fakultas & Prodi

Fakultas Teknik / Teknik Komputer (S1) / PDDIKTI : 56202

Subject
-
Kata Kunci
-
Penerbit

Banda Aceh : Fakultas Teknik., 2022

Bahasa

No Classification

-

Literature Searching Service

Hard copy atau foto copy dari buku ini dapat diberikan dengan syarat ketentuan berlaku, jika berminat, silahkan hubungi via telegram (Chat Services LSS)

Depresi merupakan kontributor primer kematian akibat bunuh diri yang mendekati 800.000 insiden bunuh diri setiap tahunnya. Gangguan depresi dapat mempengaruhi seseorang secara afektif, fisiologis, kognitif dan perilaku sehingga menyebabkan penderitanya sering mengekspresikan aktivitas dan perasaannya dengan berkomunikasi di lingkungan sosial, terutama media sosial. Twitter sebagai salah satu platform media sosial yang paling banyak diminati oleh pengguna sebagai tempat berkeluh kesah untuk menyampaikan opini atau pendapat pribadi berbasis teks melalui akun pribadinya. Opini ini dapat diprediksi adanya kecenderungan depresi melalui data teks dari Twitter berdasarkan sentimen pengguna. Dari permasalahan tersebut, dilakukan penelitian yang akan mengklasifikasi data teks menjadi dua kategori depresi, yaitu depresi berat dan depresi ringan berdasarkan riwayat pengguna dengan pendekatan klasifikasi teks berbasis Machine Learning menggunakan metode Naïve Bayes. Data teks diperoleh dari Kaggle dengan jumlah 798.622 (sentimen negatif), kemudian dilakukan pembersihan dan pelabelan data untuk dilakukan pengujian sebagai dataset dalam model klasifikasi menggunakan vektorisasi dan algoritma Multinomial Naive Bayes. Model klasifikasi dilakukan pengujian dengan data baru yang diambil dari Twitter melalui API Twitter. Hasil pengujian menggunakan dataset dari Kaggle diperoleh akurasi sebesar 95% dan skor dari f1-score sebesar 95%. Adapun data sampel diperoleh dari pengujian menggunakan data baru sebanyak 360 data yang memiliki kecenderungan depresi berat dan depresi ringan dengan jumlah paling banyak riwayat untuk depresi berat sebesar 34 twit dan depresi ringan sebesar 28 twit. Hasil penelitian menunjukkan bahwa model mampu untuk mengklasifikasi twit yang memiliki kecenderungan depresi berat dan depresi ringan.

Kata kunci: Depresi, Twitter, Sentiment Pengguna, Machine Learning, Naïve Bayes

Depression is a major contributor to suicide deaths, with close to 800,000 suicide incidents each year. Depressive disorders can affect a person affectively, physiologically, cognitively and behaviorally, causing sufferers to often express their activities and feelings by communicating in a social environment, especially on social media. Twitter as one of the social media platforms that are most in demand by users as a place to complain, to express their opinions or personal opinions based on text through their personal accounts. This opinion can predict the tendency for depression through text data from Twitter based on user sentiment. From these problems, a study was conducted that will classify texts into two categories of depression, namely major depression, and depression based on user history with a Machine Learning-based text classification approach using the Naïve Bayes method. The text of the data obtained from Kaggle with a total of 798,622 (negative sentiment), then corrected and labeled the data for testing as a collection of data in the classification model using vectorization and the Multinomial Naive Bayes algorithm. The classification model was tested with new data taken from Twitter via the Twitter API. The results of the test using a dataset from Kaggle obtained an accuracy of 95% and a score of f1-score of 95%. The sample data obtained from testing using new data are 360 data that have a tendency to severe and mild depression, with the most history of major depression at 34 tweets and mild depression at 28 tweets. The results showed that the model was able to classify tweets that had a tendency to major depression and mild depression. Keyword: Depression, Twitter, User Sentiment, Machine Learning, Naïve Bayes

Citation



    SERVICES DESK