KLASIFIKASI DATA BESAR ROAD WEATHER INFORMATION STATIONS MENGGUNAKAN NAÏVE BAYESIAN DAN RANDOM FOREST PADA SISTEM TERDISTRIBUSI HADOOP | ELECTRONIC THESES AND DISSERTATION

Electronic Theses and Dissertation

Universitas Syiah Kuala

    SKRIPSI

KLASIFIKASI DATA BESAR ROAD WEATHER INFORMATION STATIONS MENGGUNAKAN NAÏVE BAYESIAN DAN RANDOM FOREST PADA SISTEM TERDISTRIBUSI HADOOP


Pengarang

SYAMSUL KAMAL - Personal Name;

Dosen Pembimbing



Nomor Pokok Mahasiswa

1308107010040

Fakultas & Prodi

Fakultas MIPA / Informatika (S1) / PDDIKTI : 55201

Penerbit

Banda Aceh : FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SYIAH KUALA., 2017

Bahasa

Indonesia

No Classification

1

Literature Searching Service

Hard copy atau foto copy dari buku ini dapat diberikan dengan syarat ketentuan berlaku, jika berminat, silahkan hubungi via telegram (Chat Services LSS)

Di dunia yang sangat terhubung, besarnya variasi data tumbuh dan berkembang.
Sejumlah besar data dihasilkan dari sensor, satelit, media sosial dan lainnya. Salah
satu cara untuk menangani data besar adalah menggunakan Hadoop. Platform
Hadoop digunakan untuk menyimpan, mengelola, dan mendistribusi data besar di
beberapa node server. Dalam penelitian ini digunakan metode Naïve Bayesian dan
Random Forest. Data sensor yangdigunakan berjumlah 10 juta baris. Ada 4 langkah
utama dalam pendekatan yang akan dilakukan, yaitu menginstal dan
mengkonfigurasi Hadoop, preprocessing data, mengubah format data ke bentuk file
berurutan dan melakukan klasifikasi. Akurasi klasifikasi diukur dengan
menggunakan f-measure. Hasil penelitian menunjukkan bahwa metode Random
Forest lebih baik daripada metode Naïve Bayesian dengan nilai akurasi tertinggi fmeasure dari Random Forest adalah 1 dan nilai akurasi tertinggi f-measure dari
Naïve Bayesian adalah 0,66. Dalam hal waktu klasifikasi Naïve Bayesian lebih baik
dari pada Random Forest. Pada cluster Hadoop, penambahan slave node dapat
mempengaruhi kecepatan Hadoop.
Kata kunci : Apache Hadoop, Apache Mahout, Klasifikasi, Naïve Bayesian,
Random Forest

Tidak Tersedia Deskripsi

Citation



    SERVICES DESK