Universitas Syiah Kuala | ELECTRONIC THESES AND DISSERTATION

Electronic Theses and Dissertation

Universitas Syiah Kuala

    NULL
ARIQ NAUFAL KAMIL, PENGUJIAN DAN PEMBAHARUAN ALGORITMA INDOACRO UNTUK PENENTUAN PASANGAN AKRONIM DAN KEPANJANGANNYA DARI DATA TEKS DALAM BAHASA INGGRIS. Banda Aceh Universitas Syiah Kuala,2020

Data teks yang sangat besar saat ini dapat diolah untuk mendapatkan informasi yang bermanfaat. salah satu data teks yang penting untuk diolah adalah data akronim. data akronim diolah untuk mendapatkan informasi mengenai kepanjangan akronim tersebut. akronim pada umumnya didefinisikan sebagai singkatan yang dibentuk oleh huruf awal atau gabungan beberapa huruf dari suatu istilah penting. akronim sering ditemukan dalam sebuah tulisan. banyak penelitian yang mengkaji penentuan akronim dan kepanjangannya yang ditulis dalam bahasa inggris antara tahun 1999 hingga 2006. sementara, kajian yang membahas algoritma dalam bahasa indonesia untuk menentukan akronim dan kepanjangannya masih sangat minim, hanya kajian dari wahyudi dan abidin pada tahun 2011. lanjutan penelitian tersebut telah menghasilkan repositori indoacro yang dapat mendeteksi akronim dan kepanjangannya dalam bahasa indonesia. penelitian ini, menguji algoritma indoacro (indonesian acronym) menggunakan data teks pasangan akronim dan kepanjangannya dalam bahasa inggris dan menganalisa kemampuan algoritma indoacro tersebut dalam menentukan pasangan akronim dan kepanjangannya berbahasa inggris. metode yang digunakan pada penelitian ini adalah metode klasifikasi svm (support vector machine). pembangunan model svm berbahasa inggris dengan kernel polynomial memiliki nilai keakuratan tertinggi, yang mencapai nilai 93.44%, mengungguli model svm dengan kernel linear yang bernilai 91.97%. model svm berbahasa inggris juga mengungguli saat tahap pengujian dengan menggunakan data testing dengan hasil klasifikasi bernilai 92.17%, sedangkan pengujian dengan menggunakan model svm berbahasa indonesia sangatlah rendah yaitu bernilai 62.70%. pada pengujian 5.000 data artikel berita dengan algoritma indoacro, saat menggunakan model svm berbahasa inggris, ditemukan 1.957 pasangan akronim dan kepanjangannya yang benar, sedangkan saat menggunakan model svm berbahasa indonesia 1.698 pasangan akronim dan kepanjangannya yang benar ditemukan. perbandingan ini membuktikan bahwa model svm berbahasa inggris merupakan model yang lebih baik dalam menentukan pasangan akronim dan kepanjangannya dalam data teks berbahasa inggris kata kunci: akronim dan kepanjangannya, indoacro, klasifikasi, support vector machine, kernel.



Abstract



    SERVICES DESK