PERBANDINGAN PERFORMA METODE PARALEL SVM DAN K-NN DALAM MENGKLASIFIKASI PASANGAN AKRONIM DAN KEPANJANGANNYA MENGGUNAKAN TEKNOLOGI BIG DATA SPARK | ELECTRONIC THESES AND DISSERTATION

Electronic Theses and Dissertation

Universitas Syiah Kuala

    NULL

PERBANDINGAN PERFORMA METODE PARALEL SVM DAN K-NN DALAM MENGKLASIFIKASI PASANGAN AKRONIM DAN KEPANJANGANNYA MENGGUNAKAN TEKNOLOGI BIG DATA SPARK


Pengarang

Denny Syaputra - Personal Name;

Dosen Pembimbing



Nomor Pokok Mahasiswa

1508107010036

Fakultas & Prodi

Fakultas MIPA / Informatika (S1) / PDDIKTI : 55201

Subject
-
Kata Kunci
-
Penerbit

Banda Aceh : Universitas Syiah Kuala., 2020

Bahasa

Indonesia

No Classification

-

Literature Searching Service

Hard copy atau foto copy dari buku ini dapat diberikan dengan syarat ketentuan berlaku, jika berminat, silahkan hubungi via telegram (Chat Services LSS)

Data dalam jumlah yang besar dihasilkan setiap detiknya, hal ini membuat jumlah data bertambah secara eksponensial. Penambahan ini membawa masalah pada pemrosesan data karena akan membutuhkan waktu yang sangat lama apabila menggunakan satu mesin, untuk mengatasi hal tersebut maka proses komputasi bisa dilakukan secara paralel. Salah satu hal yang dapat diekstrak dari data teks adalah akronim dan kepanjangannya. Penelitian yang telah dilakukan pada ekstraksi pasangan akronim dan ekspansinya dari data teks masih menggunakan satu mesin. Penelitian ini berfokus pada melakukan pembangkitan pasangan-pasangan kandidat akronim dan ekspansinya serta fitur-fiturnya dari 100.000 dan 200.000 data artikel menggunakan Hadoop MapReduce dengan bahasa pemrograman Perl dan Java serta melakukan klasifikasi menggunakan Apache Spark untuk metode Paralel SVM dan K-NN. Hasil yang didapat dari proses pembangkitan fitur-fitur pasangan kandidat akronim dan ekspansinya adalah Perl dengan library Hadoop Streaming jauh mengungguli Java dalam melakukan pembangkitan fitur. Saat memproses 200.000 artikel, Perl dengan 39 server hanya membutuhkan waktu 2 jam 2 menit sementara Java membutuhkan waktu 22 jam 28 menit. Sedangkan selama proses klasifikasi, meskipun Paralel SVM memiliki nilai F-Measure yang sedikit lebih rendah dibandingkan K-NN, namun Paralel SVM membutuhkan waktu yang jauh lebih sedikit. Waktu yang dibutuhkan Paralel SVM untuk mengklasifikasi 119 juta pasangan kandidat akronim dan ekspansinya menggunakan 39 server adalah 1 menit 18 detik sedangkan K-NN membutuhkan 26 menit 42 detik.

Tidak Tersedia Deskripsi

Citation



    SERVICES DESK