PENGUJIAN DAN PEMBAHARUAN ALGORITMA INDOACRO UNTUK PENENTUAN PASANGAN AKRONIM DAN KEPANJANGANNYA DARI DATA TEKS DALAM BAHASA INGGRIS | ELECTRONIC THESES AND DISSERTATION

Electronic Theses and Dissertation

Universitas Syiah Kuala

    NULL

PENGUJIAN DAN PEMBAHARUAN ALGORITMA INDOACRO UNTUK PENENTUAN PASANGAN AKRONIM DAN KEPANJANGANNYA DARI DATA TEKS DALAM BAHASA INGGRIS


Pengarang

ARIQ NAUFAL KAMIL - Personal Name;

Dosen Pembimbing



Nomor Pokok Mahasiswa

1508107010062

Fakultas & Prodi

Fakultas MIPA / Informatika (S1) / PDDIKTI : 55201

Subject
-
Penerbit

Banda Aceh : Universitas Syiah Kuala., 2020

Bahasa

Indonesia

No Classification

-

Literature Searching Service

Hard copy atau foto copy dari buku ini dapat diberikan dengan syarat ketentuan berlaku, jika berminat, silahkan hubungi via telegram (Chat Services LSS)

Data teks yang sangat besar saat ini dapat diolah untuk mendapatkan informasi yang bermanfaat. Salah satu data teks yang penting untuk diolah adalah data akronim. Data akronim diolah untuk mendapatkan informasi mengenai kepanjangan akronim tersebut. Akronim pada umumnya didefinisikan sebagai singkatan yang dibentuk oleh huruf awal atau gabungan beberapa huruf dari suatu istilah penting. Akronim sering ditemukan dalam sebuah tulisan. Banyak penelitian yang mengkaji penentuan akronim dan kepanjangannya yang ditulis dalam Bahasa Inggris antara tahun 1999 hingga 2006. Sementara, kajian yang membahas algoritma dalam Bahasa Indonesia untuk menentukan akronim dan kepanjangannya masih sangat minim, hanya kajian dari Wahyudi dan Abidin pada tahun 2011. Lanjutan penelitian tersebut telah menghasilkan repositori IndoAcro yang dapat mendeteksi akronim dan kepanjangannya dalam Bahasa Indonesia. Penelitian ini, menguji algoritma IndoAcro (Indonesian Acronym) menggunakan data teks pasangan akronim dan kepanjangannya dalam Bahasa Inggris dan menganalisa kemampuan algoritma IndoAcro tersebut dalam menentukan pasangan akronim dan kepanjangannya berbahasa Inggris. Metode yang digunakan pada penelitian ini adalah metode klasifikasi SVM (Support Vector Machine). Pembangunan model SVM berbahasa Inggris dengan kernel polynomial memiliki nilai keakuratan tertinggi, yang mencapai nilai 93.44%, mengungguli model SVM dengan kernel linear yang bernilai 91.97%. Model SVM berbahasa Inggris juga mengungguli saat tahap pengujian dengan menggunakan data testing dengan hasil klasifikasi bernilai 92.17%, sedangkan pengujian dengan menggunakan model SVM berbahasa Indonesia sangatlah rendah yaitu bernilai 62.70%. Pada pengujian 5.000 data artikel berita dengan algoritma IndoAcro, saat menggunakan model SVM berbahasa Inggris, ditemukan 1.957 pasangan akronim dan kepanjangannya yang benar, sedangkan saat menggunakan model SVM berbahasa Indonesia 1.698 pasangan akronim dan kepanjangannya yang benar ditemukan. Perbandingan ini membuktikan bahwa model SVM berbahasa Inggris merupakan model yang lebih baik dalam menentukan pasangan akronim dan kepanjangannya dalam data teks berbahasa Inggris

Kata kunci: Akronim dan Kepanjangannya, IndoAcro, Klasifikasi, Support Vector Machine, Kernel.

Tidak Tersedia Deskripsi

Citation



    SERVICES DESK