<?xml version="1.0" encoding="UTF-8" ?>
<modsCollection xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="http://www.loc.gov/mods/v3" xmlns:slims="http://slims.web.id" xsi:schemaLocation="http://www.loc.gov/mods/v3 http://www.loc.gov/standards/mods/v3/mods-3-3.xsd">
<mods version="3.3" id="112523">
 <titleInfo>
  <title>PENERAPAN X-VECTORS EMBEDDING PADA SISTEM IDENTIFIKASI PEMBICARA BERBAHASA INDONESIA</title>
 </titleInfo>
 <name type="Personal Name" authority="">
  <namePart>Muhammad Saifullah Sani</namePart>
  <role>
   <roleTerm type="text">Primary Author</roleTerm>
  </role>
 </name>
 <typeOfResource manuscript="no" collection="yes">mixed material</typeOfResource>
 <genre authority="marcgt">bibliography</genre>
 <originInfo>
  <place>
   <placeTerm type="text">Banda Aceh</placeTerm>
   <publisher>Fakultas MIPA - Informatika</publisher>
   <dateIssued>2023</dateIssued>
  </place>
 </originInfo>
 <language>
  <languageTerm type="code">id</languageTerm>
  <languageTerm type="text">Indonesia</languageTerm>
 </language>
 <physicalDescription>
  <form authority="gmd">Skripsi</form>
  <extent></extent>
 </physicalDescription>
 <note>Banyak alat canggih telah menggunakan teknologi speech recognition atau pengenalan ucapan, seperti pada laptop, mobil pintar, dan ponsel cerdas. Teknologi pengenalan ucapan memuat speaker recognition atau pengenalan pembicara untuk mendapatkan informasi individu yang menunjukkan siapa yang sedang berbicara. Berdasarkan perbedaan aturan penggunaannya, sistem pengenalan pembicara dibedakan menjadi speaker identification dan speaker verification. Algoritma terkini dalam sistem pengenalan pembicara menggunakan model deep neural network (DNN) dan diekstrak speaker embedding yang bernama x-vectors, yaitu vektor fitur yang merepresentasikan pembicara. Penelitian ini bertujuan untuk membangun model speaker identification dengan menerapkan algoritma terkini yang memiliki performa yang baik, terutama untuk dataset pembicara berbahasa Indonesia agar dapat digunakan pada aplikasi yang membutuhkan sistem identifikasi pembicara berbahasa Indonesia. Oleh karena itu, perlu dibangun dataset pembicara berbahasa Indonesia terlebih dahulu yang kemudian dinamai dataset INF19. Fitur-fitur yang digunakan untuk membangun model berupa mel frequency cepstrum coefficient (MFCC) yang diekstrak dari dataset data train, yaitu VoxCeleb1 dev, VoxCeleb2 dev, dan VoxCeleb2 test, yang diaugmentasi menggunakan dataset RIRs Noise dan MUSAN. Dibangun empat model dengan menggunakan kombinasi dari dua konfigurasi MFCC dan dua arsitektur DNN yang memanfaatkan time delay neural network (TDNN) dengan mengikuti recipe Voxceleb v2 di Kaldi. Model-model yang dibangun diberi nama Model-I, Model-II, Model-III, dan Model-IV. Pengujian model menggunakan dataset VoxCeleb1 test, inf19_test_td, dan inf19_test_tid. Dipilih model terbaik berdasarkan akurasi tertinggi yang dihitung menggunakan metrik equal error rate (EER) dan durasi ekstraksi x-vectors tersingkat. Berdasarkan hasil pengujian, Model-II adalah model yang terbaik. Nilai EER Model-II untuk dataset VoxCeleb1 test sebesar 3,51%, inf19_test_td sebesar 1,3%, dan inf19_test_tid sebesar 1,4%. Durasi ekstraksi x-vectors menggunakan Model-II untuk dataset data train berdurasi 6 jam 42 menit 39 detik, VoxCeleb1 test berdurasi 2 menit 24 detik, inf19_enroll berdurasi 18 detik, inf19_test_td berdurasi 25 detik, dan inf19_test_tid berdurasi 9 detik. &#13;
&#13;
Kata kunci: Speaker Identification, Time Delay Neural Network, X-Vectors, Mel Frequency Cepstrum Coefficient, Kaldi, Equal Error Rate</note>
 <note type="statement of responsibility"></note>
 <subject authority="">
  <topic>ALGORITHMS - COMPUTER PROGRAMMING</topic>
 </subject>
 <classification>005.1</classification>
 <identifier type="isbn"></identifier>
 <location>
  <physicalLocation>ELECTRONIC THESES AND DISSERTATION Universitas Syiah Kuala</physicalLocation>
  <shelfLocator></shelfLocator>
 </location>
 <slims:digitals/>
</mods>
<recordInfo>
 <recordIdentifier>112523</recordIdentifier>
 <recordCreationDate encoding="w3cdtf">2023-07-06 17:12:39</recordCreationDate>
 <recordChangeDate encoding="w3cdtf">2023-07-07 11:11:41</recordChangeDate>
 <recordOrigin>machine generated</recordOrigin>
</recordInfo>
</modsCollection>