Universitas Syiah Kuala | ELECTRONIC THESES AND DISSERTATION

Electronic Theses and Dissertation

Universitas Syiah Kuala

    NULL
Denny Syaputra, PERBANDINGAN PERFORMA METODE PARALEL SVM DAN K-NN DALAM MENGKLASIFIKASI PASANGAN AKRONIM DAN KEPANJANGANNYA MENGGUNAKAN TEKNOLOGI BIG DATA SPARK. Banda Aceh Universitas Syiah Kuala,2020

Data dalam jumlah yang besar dihasilkan setiap detiknya, hal ini membuat jumlah data bertambah secara eksponensial. penambahan ini membawa masalah pada pemrosesan data karena akan membutuhkan waktu yang sangat lama apabila menggunakan satu mesin, untuk mengatasi hal tersebut maka proses komputasi bisa dilakukan secara paralel. salah satu hal yang dapat diekstrak dari data teks adalah akronim dan kepanjangannya. penelitian yang telah dilakukan pada ekstraksi pasangan akronim dan ekspansinya dari data teks masih menggunakan satu mesin. penelitian ini berfokus pada melakukan pembangkitan pasangan-pasangan kandidat akronim dan ekspansinya serta fitur-fiturnya dari 100.000 dan 200.000 data artikel menggunakan hadoop mapreduce dengan bahasa pemrograman perl dan java serta melakukan klasifikasi menggunakan apache spark untuk metode paralel svm dan k-nn. hasil yang didapat dari proses pembangkitan fitur-fitur pasangan kandidat akronim dan ekspansinya adalah perl dengan library hadoop streaming jauh mengungguli java dalam melakukan pembangkitan fitur. saat memproses 200.000 artikel, perl dengan 39 server hanya membutuhkan waktu 2 jam 2 menit sementara java membutuhkan waktu 22 jam 28 menit. sedangkan selama proses klasifikasi, meskipun paralel svm memiliki nilai f-measure yang sedikit lebih rendah dibandingkan k-nn, namun paralel svm membutuhkan waktu yang jauh lebih sedikit. waktu yang dibutuhkan paralel svm untuk mengklasifikasi 119 juta pasangan kandidat akronim dan ekspansinya menggunakan 39 server adalah 1 menit 18 detik sedangkan k-nn membutuhkan 26 menit 42 detik.



Abstract



    SERVICES DESK