PERBANDINGAN PERFORMA METODE CNN DAN INDOBERT UNTUK KLASIFIKASI JUDUL BERITA DALAM BAHASA INDONESIA YANG HOAKS DAN TERPERCAYA | ELECTRONIC THESES AND DISSERTATION

Electronic Theses and Dissertation

Universitas Syiah Kuala

    SKRIPSI

PERBANDINGAN PERFORMA METODE CNN DAN INDOBERT UNTUK KLASIFIKASI JUDUL BERITA DALAM BAHASA INDONESIA YANG HOAKS DAN TERPERCAYA


Pengarang

NUR ULFAH ATIQAH - Personal Name;

Dosen Pembimbing

Ridha Ferdhiana - 197302141998022001 - Dosen Pembimbing I
Laina Farsiah - 198902032022032004 - Dosen Pembimbing II



Nomor Pokok Mahasiswa

2008108010050

Fakultas & Prodi

Fakultas MIPA / Statistika (S1) / PDDIKTI : 49201

Subject
-
Kata Kunci
-
Penerbit

Banda Aceh : Fakultas MIPA Statistika., 2024

Bahasa

No Classification

-

Literature Searching Service

Hard copy atau foto copy dari buku ini dapat diberikan dengan syarat ketentuan berlaku, jika berminat, silahkan hubungi via telegram (Chat Services LSS)

Metode klasifikasi teks adalah metode yang mengelompokkan teks ke dalam kategori tertentu berdasarkan karakteristik tertentu. Dua metode klasifikasi data teks yang bisa digunakan adalah CNN dan IndoBERT. Metode-metode klasifikasi teks ini dapat digunakan untuk klasifikasi data berbasis teks, contohnya klasifikasi judul berita hoaks dan terpercaya. Kebanyakan orang hanya membaca judul berita tanpa membaca seluruh konten, sehingga tidak mengetahui jika berita tersebut terpercaya atau palsu. Sehingga perlu dibandingkan performa dari kedua metode tersebut dalam klasifikasi berita hoaks dan terpercaya dalam Bahasa Indonesia. IndoBERT merupakan salah satu bagian dari metode Bidirectional Encoder Representations from Transformers (BERT). IndoBERT merupakan metode BERT dengan menggunakan model berbahasa Indonesia.Convolutional Neural Network (CNN) adalah jenis jaringan saraf yang memiliki serangkaian layer konvolusional dan penyatuan. Data yang digunakan pada penelitian ini adalah data judul-judul berita dalam bahasa Indonesia. Judul berita terpercaya diperoleh dari portal berita https://www.cnnindonesia.com/, https://www.detik.com/, https://www.kompas.com/, dan https://www.liputan6.com/. Judul berita hoaks diperoleh dari portal berita https://turnbackhoax.id/. Hasil dari penelitian ini menunjukkan performa model IndoBERT lebih baik daripada model CNN. Nilai accuracy, precision, recall, dan F1- score dari model IndoBERT untuk data training adalah sama yaitu sebesar 1,000 dan data testing adalah 0,932. Sementara model CNN nilai accuracy, precision, recall, dan F1-score untuk data training adalah sama yaitu sebesar 0,933 kecuali precision adalah 0,934, sedangkan untuk data testing adalah 0,880.

Text classification methods are methods that group text into certain categories based on certain characteristics. Two text data classification methods that can be used are CNN and IndoBERT. These text classification methods can be used to classify data based on text, for example classifying hoax and trustworthy news headlines Most people only read the headline without reading the entire content, so they don't know whether the news is reliable or fake. So it is necessary to compare the performance of the two methods in classifying hoax and trusted news in Indonesian. IndoBERT is one part of the Bidirectional Encoder Representations from Transformers (BERT) method. IndoBERT is a BERT method using an Indonesian language model. A convolutional Neural Network (CNN) is a type of neural network that has a series of convolutional and unification layers. The data used in this research is data from news titles in Indonesian. Trusted news titles were obtained from the news portals https://www.cnnindonesia.com/, https://www.detik.com/, https://www.kompas.com/, and https://www.liputan6.com/. The title of the hoax news was obtained from the news portal https://turnbackhoax.id/. The results of this research show that the performance of the IndoBERT model is better than the CNN model. The accuracy, precision, recall, and F1-score values of the IndoBERT model for the training data are the same 1.000, and for the testing data is 0.932. Meanwhile, for the CNN model, the accuracy, precision, recall, and F1-score values for the training data are the same, namely 0.933, except that the precision is 0.934, while for the testing data, it is 0.880.

Citation



    SERVICES DESK