Electronic Theses and Dissertation
Universitas Syiah Kuala
SKRIPSI
PERBANDINGAN PERFORMA METODE CNN DAN INDOBERT UNTUK KLASIFIKASI JUDUL BERITA DALAM BAHASA INDONESIA YANG HOAKS DAN TERPERCAYA
Pengarang
NUR ULFAH ATIQAH - Personal Name;
Dosen Pembimbing
Ridha Ferdhiana - 197302141998022001 - Dosen Pembimbing I
Laina Farsiah - 198902032022032004 - Dosen Pembimbing II
Nomor Pokok Mahasiswa
2008108010050
Fakultas & Prodi
Fakultas MIPA / Statistika (S1) / PDDIKTI : 49201
Subject
Kata Kunci
Penerbit
Banda Aceh : Fakultas MIPA Statistika., 2024
Bahasa
No Classification
-
Literature Searching Service
Hard copy atau foto copy dari buku ini dapat diberikan dengan syarat ketentuan berlaku, jika berminat, silahkan hubungi via telegram (Chat Services LSS)
Metode klasifikasi teks adalah metode yang mengelompokkan teks ke dalam kategori tertentu berdasarkan karakteristik tertentu. Dua metode klasifikasi data teks yang bisa digunakan adalah CNN dan IndoBERT. Metode-metode klasifikasi teks ini dapat digunakan untuk klasifikasi data berbasis teks, contohnya klasifikasi judul berita hoaks dan terpercaya. Kebanyakan orang hanya membaca judul berita tanpa membaca seluruh konten, sehingga tidak mengetahui jika berita tersebut terpercaya atau palsu. Sehingga perlu dibandingkan performa dari kedua metode tersebut dalam klasifikasi berita hoaks dan terpercaya dalam Bahasa Indonesia. IndoBERT merupakan salah satu bagian dari metode Bidirectional Encoder Representations from Transformers (BERT). IndoBERT merupakan metode BERT dengan menggunakan model berbahasa Indonesia.Convolutional Neural Network (CNN) adalah jenis jaringan saraf yang memiliki serangkaian layer konvolusional dan penyatuan. Data yang digunakan pada penelitian ini adalah data judul-judul berita dalam bahasa Indonesia. Judul berita terpercaya diperoleh dari portal berita https://www.cnnindonesia.com/, https://www.detik.com/, https://www.kompas.com/, dan https://www.liputan6.com/. Judul berita hoaks diperoleh dari portal berita https://turnbackhoax.id/. Hasil dari penelitian ini menunjukkan performa model IndoBERT lebih baik daripada model CNN. Nilai accuracy, precision, recall, dan F1- score dari model IndoBERT untuk data training adalah sama yaitu sebesar 1,000 dan data testing adalah 0,932. Sementara model CNN nilai accuracy, precision, recall, dan F1-score untuk data training adalah sama yaitu sebesar 0,933 kecuali precision adalah 0,934, sedangkan untuk data testing adalah 0,880.
Text classification methods are methods that group text into certain categories based on certain characteristics. Two text data classification methods that can be used are CNN and IndoBERT. These text classification methods can be used to classify data based on text, for example classifying hoax and trustworthy news headlines Most people only read the headline without reading the entire content, so they don't know whether the news is reliable or fake. So it is necessary to compare the performance of the two methods in classifying hoax and trusted news in Indonesian. IndoBERT is one part of the Bidirectional Encoder Representations from Transformers (BERT) method. IndoBERT is a BERT method using an Indonesian language model. A convolutional Neural Network (CNN) is a type of neural network that has a series of convolutional and unification layers. The data used in this research is data from news titles in Indonesian. Trusted news titles were obtained from the news portals https://www.cnnindonesia.com/, https://www.detik.com/, https://www.kompas.com/, and https://www.liputan6.com/. The title of the hoax news was obtained from the news portal https://turnbackhoax.id/. The results of this research show that the performance of the IndoBERT model is better than the CNN model. The accuracy, precision, recall, and F1-score values of the IndoBERT model for the training data are the same 1.000, and for the testing data is 0.932. Meanwhile, for the CNN model, the accuracy, precision, recall, and F1-score values for the training data are the same, namely 0.933, except that the precision is 0.934, while for the testing data, it is 0.880.
DAMPAK BERITA HOAKS TERHADAP INTERAKSI SOSIAL MASYARAKAT BANDA ACEH DALAM PEMILU 2024: PERSPEKTIF SOSIOLOGI KONTRUKSI SOSIAL (MUHAMMAD FIRDHAUS, 2024)
DETEKSI POTENSI PELANGGARAN UU ITE DARI KOMENTAR YOUTUBE DAN TIKTOK MENGGUNAKAN INDOBERT DAN CNN-BILSTM (Aulia Muzhaffar, 2026)
ANALISIS SENTIMEN ULASAN PENGGUNA TWITTER DAN ARTIKEL BERITA ONLINE TERHADAP DAMPAK CHATGPT DALAM BIDANG PENDIDIKAN (Muhammad Faris Adzkia, 2024)
PERBANDINGAN METODE SVM, NAIVE BAYES DAN INDOBERT DALAM MENDETEKSI UJARAN KEBENCIAN MENGGUNAKAN DATASET MULTI-LABEL BERBAHASA INDONESIA (Ricky Bagestra, 2024)
INTEGRASI INDOBERT DAN FITUR MACHINE LEARNING UNTUK MENINGKATKAN KINERJA PENGENALAN KETERKAITAN TEKSTUAL DALAM BAHASA INDONESIA (Teuku Yusransyah Tandi, 2024)