<?xml version="1.0" encoding="UTF-8" ?>
<modsCollection xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="http://www.loc.gov/mods/v3" xmlns:slims="http://slims.web.id" xsi:schemaLocation="http://www.loc.gov/mods/v3 http://www.loc.gov/standards/mods/v3/mods-3-3.xsd">
<mods version="3.3" id="142063">
 <titleInfo>
  <title>PERBANDINGAN METODE SVM, NAIVE BAYES DAN INDOBERT DALAM MENDETEKSI UJARAN KEBENCIAN MENGGUNAKAN DATASET MULTI-LABEL BERBAHASA INDONESIA</title>
 </titleInfo>
 <name type="Personal Name" authority="">
  <namePart>Ricky Bagestra</namePart>
  <role>
   <roleTerm type="text">Primary Author</roleTerm>
  </role>
 </name>
 <typeOfResource manuscript="no" collection="yes">mixed material</typeOfResource>
 <genre authority="marcgt">bibliography</genre>
 <originInfo>
  <place>
   <placeTerm type="text">Banda Aceh</placeTerm>
   <publisher>Fakultas MIPA Informatika</publisher>
   <dateIssued>2024</dateIssued>
  </place>
 </originInfo>
 <language>
  <languageTerm type="code"></languageTerm>
  <languageTerm type="text"></languageTerm>
 </language>
 <physicalDescription>
  <form authority="gmd">Skripsi</form>
  <extent></extent>
 </physicalDescription>
 <note>Penelitian ini bertujuan untuk membandingkan performa metode Support Vector Machine (SVM), Naive Bayes, dan IndoBERT dalam deteksi ujaran kebencian pada dataset multi-label berbahasa Indonesia. Dataset yang digunakan berasal dari penelitian Ibrohim dan Budi (2019), terdiri dari 13.169 tweet dengan 12 label. Proses pre-processing data dilakukan untuk mempersiapkan dataset, mencakup case folding, penghapusan karakter yang tidak diperlukan, normalisasi kata alay, stemming, dan penghapusan stopword. Perbandingan performa dilakukan sebelum dan sesudah proses tuning untuk setiap metode. Faktor-faktor yang mempengaruhi performa masing- masing metode dianalisis, meliputi karakteristik dataset, fitur bahasa, teknik pra- pemrosesan, arsitektur model, dan ketersediaan sumber daya komputasi. Penanganan ketidakseimbangan kelas menggunakan teknik augmentasi data berbasis BERT juga dievaluasi dampaknya terhadap performa metode. Hasil penelitian menunjukkan bahwa metode IndoBERT memberikan performa terbaik setelah tuning, dengan akurasi 93%, F1-score 91%, recall 91%, dan precision 91%. SVM dan Naive Bayes juga mengalami peningkatan performa setelah tuning, meskipun tidak sebaik IndoBERT. Augmentasi data berbasis BERT terbukti efektif dalam meningkatkan performa semua metode. Model terbaik diimplementasikan dalam interface web menggunakan framework Flask untuk memudahkan pengguna dalam mendeteksi ujaran kebencian pada teks berbahasa Indonesia. Penelitian ini memberikan kontribusi pada pengembangan sistem deteksi ujaran kebencian yang lebih akurat dan efisien, serta memberikan wawasan tentang faktor-faktor yang mempengaruhi performa metode dalam konteks bahasa Indonesia.&#13;
Kata kunci: Deteksi Ujaran Kebencian, Bahasa Kasar, Support Vector Machine, Naive Bayes, IndoBERT.</note>
 <note type="statement of responsibility"></note>
 <classification>0</classification>
 <identifier type="isbn"></identifier>
 <location>
  <physicalLocation>ELECTRONIC THESES AND DISSERTATION Universitas Syiah Kuala</physicalLocation>
  <shelfLocator></shelfLocator>
 </location>
 <slims:digitals/>
</mods>
<recordInfo>
 <recordIdentifier>142063</recordIdentifier>
 <recordCreationDate encoding="w3cdtf">2024-12-02 15:12:57</recordCreationDate>
 <recordChangeDate encoding="w3cdtf">2024-12-02 15:58:29</recordChangeDate>
 <recordOrigin>machine generated</recordOrigin>
</recordInfo>
</modsCollection>