PERBANDINGAN METODE NAÏVE BAYES DAN DECISION TREE DALAM MENENTUKAN PASANGAN AKRONIM DAN EKSPANSINYA MENGGUNAKAN TEKNOLOGI BIG DATA SPARK | ELECTRONIC THESES AND DISSERTATION

Electronic Theses and Dissertation

Universitas Syiah Kuala

    NULL

PERBANDINGAN METODE NAÏVE BAYES DAN DECISION TREE DALAM MENENTUKAN PASANGAN AKRONIM DAN EKSPANSINYA MENGGUNAKAN TEKNOLOGI BIG DATA SPARK


Pengarang

TEUKU WAHYU ARDHIAN PUTERA - Personal Name;

Dosen Pembimbing



Nomor Pokok Mahasiswa

1508107010053

Fakultas & Prodi

Fakultas MIPA / Informatika (S1) / PDDIKTI : 55201

Subject
-
Kata Kunci
-
Penerbit

Banda Aceh : Universitas Syiah Kuala., 2020

Bahasa

Indonesia

No Classification

-

Literature Searching Service

Hard copy atau foto copy dari buku ini dapat diberikan dengan syarat ketentuan berlaku, jika berminat, silahkan hubungi via telegram (Chat Services LSS)

Penambangan informasi dari data halaman web untuk menentukan secara otomatis akronim dan ekspansinya merupakan hal yang menarik untuk dilakukan mengingat aturan penulisan akronim dan ekspansinya yang bermacam ragam. Selain itu, banyaknya jumlah data hingga mencapai ratusan juta mendorong penelitian untuk menerapkan teknologi bigdata dalam tahapan mendapatkan akronim dan ekspansinya pada halaman web. Penelitian ini memanfaatkan teknologi Big Data hadoop MapReduce dan Apache Spark untuk ekstraksi kandidat dan fitur akronim dan ekspansinya serta mengklasifikasikan ratusan juta data akronim dan ekspansinya. Proses ekstraksi kandidat dan fitur yang sebelumnya menggunakan kode program Perl pada penelitian ini dikonversikan ke dalam bahasa Java dengan tujuan membandingkan waktu komputasi untuk kedua kode program. Proses komputasi dilakukan pada jumlah node yang berbeda yaitu 13, 26 dan 39 node. Hasil perbandingan pada 39 node, waktu komputasi menunjukkan kode program perl memiliki waktu komputasi yang sangat cepat dibandingkan dengan kode program Java dan untuk mengekstraksi data dugaan akronim dan ekspansinya dari 200.000 data artikel web, kode program Perl hanya membutuhkan waktu 2 jam 44 menit 22 detik sedangkan menggunakan kode program Java membutuhkan waktu 22 jam 28 menit 30 detik. Proses klasifikasi ratusan juta data akronim dan ekspansinya menggunakan dua metode yaitu Naïve Bayes dan Decision Tree juga dilakukan pada jumlah node yang berbeda yaitu 13, 26 dan 39. Metode Decision Tree memiliki peforma lebih unggul dibandingkan dengan metode Naïve Bayes. Decision Tree memiliki nilai F-Measure sebesar 99.21% dan untuk Naïve bayes memiliki nilai F-Measure sebesar 98.54%. Namun, dalam menyelesaikan proses klasifikasi ratusan juta data akronim dan ekspansinya dilakukan pada 39 node, metode Naïve Bayes jauh lebih cepat dibandingkan dengan Decision Tree. Metode Naïve Bayes hanya membutuhkan waktu 1 menit 38 detik untuk melakukan klasifikasi ratusan juta data tersebut sedangkan metode Decision Tree membutuhkan waktu 1 menit 52 detik.

Tidak Tersedia Deskripsi

Citation



    SERVICES DESK