Electronic Theses and Dissertation
Universitas Syiah Kuala
SKRIPSI
KLASIFIKASI DATA BESAR ROAD WEATHER INFORMATION STATIONS MENGGUNAKAN NAÏVE BAYESIAN DAN RANDOM FOREST PADA SISTEM TERDISTRIBUSI HADOOP
Pengarang
SYAMSUL KAMAL - Personal Name;
Dosen Pembimbing
Nomor Pokok Mahasiswa
1308107010040
Fakultas & Prodi
Fakultas MIPA / Informatika (S1) / PDDIKTI : 55201
Subject
Kata Kunci
Penerbit
Banda Aceh : FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SYIAH KUALA., 2017
Bahasa
Indonesia
No Classification
1
Literature Searching Service
Hard copy atau foto copy dari buku ini dapat diberikan dengan syarat ketentuan berlaku, jika berminat, silahkan hubungi via telegram (Chat Services LSS)
Di dunia yang sangat terhubung, besarnya variasi data tumbuh dan berkembang.
Sejumlah besar data dihasilkan dari sensor, satelit, media sosial dan lainnya. Salah
satu cara untuk menangani data besar adalah menggunakan Hadoop. Platform
Hadoop digunakan untuk menyimpan, mengelola, dan mendistribusi data besar di
beberapa node server. Dalam penelitian ini digunakan metode Naïve Bayesian dan
Random Forest. Data sensor yangdigunakan berjumlah 10 juta baris. Ada 4 langkah
utama dalam pendekatan yang akan dilakukan, yaitu menginstal dan
mengkonfigurasi Hadoop, preprocessing data, mengubah format data ke bentuk file
berurutan dan melakukan klasifikasi. Akurasi klasifikasi diukur dengan
menggunakan f-measure. Hasil penelitian menunjukkan bahwa metode Random
Forest lebih baik daripada metode Naïve Bayesian dengan nilai akurasi tertinggi fmeasure dari Random Forest adalah 1 dan nilai akurasi tertinggi f-measure dari
Naïve Bayesian adalah 0,66. Dalam hal waktu klasifikasi Naïve Bayesian lebih baik
dari pada Random Forest. Pada cluster Hadoop, penambahan slave node dapat
mempengaruhi kecepatan Hadoop.
Kata kunci : Apache Hadoop, Apache Mahout, Klasifikasi, Naïve Bayesian,
Random Forest
Tidak Tersedia Deskripsi
OPTIMASI HADOOP CLUSTER DENGAN TUNING RNPARAMETER KONFIGURASI (Harits Arunda Achsan, 2023)
PERBANDINGAN KINERJA RANDOM FOREST, SUPPORT VECTOR MACHINE, DAN ADABOOST DALAM KLASIFIKASI ARITMIA (Muhammad Raja Al Sahhaf, 2025)
PERANGCANGAN DAN PEMBUATAN SISTEM INFORMASI BERBASIS WEBSITE REGISTERASI SECARA DARING CALON PENERIMA BEASISWA (SAID ALFIYATUSY SYUKRA, 2018)
PENGARUH PENERAPAN SISTEM INFORMASI AKUNTANSI, KEMAMPUAN TEKNIK PEMAKAI SISTEM INFORMASI AKUNTANSI, PEMANFAATAN TEKNOLOGI INFORMASI, DAN KEPERCAYAAN PENGGUNAAN TEKNOLOGI INFORMASI TERHADAP KINERJA KARYAWAN (STUDI EMPIRIS PADA SATUAN KERJA PERANGKAT KOTA BANDA ACEH) (Ade Maulina, 2016)
PERBANDINGAN METODE CLUSTERING K-MEANS DAN K-MEDIANS PADA DATA BESAR MENGGUNAKAN HADOOP (Amalul Ahli, 2018)