Electronic Theses and Dissertation

Universitas Syiah Kuala

SKRIPSI

PERBANDINGAN METODE CLUSTERING K-MEANS DAN K-MEDIANS PADA DATA BESAR MENGGUNAKAN HADOOP

Pengarang

Amalul Ahli - Personal Name;

Dosen Pembimbing

Nomor Pokok Mahasiswa

1308107010006

Fakultas & Prodi

Fakultas MIPA / Informatika (S1) / PDDIKTI : 55201

Subject

HIGHER EDUCATION

Kata Kunci

APACHE HADOOP
METODE CLUSTERING
K-MEANS
K-MEDIANS
MENGGUNAKAN HADOOP
BIG DATA

Penerbit

Banda Aceh : FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SYIAH KUALA., 2018

Bahasa

Indonesia

No Classification

Literature Searching Service

Hard copy atau foto copy dari buku ini dapat diberikan dengan syarat ketentuan berlaku, jika berminat, silahkan hubungi via telegram (Chat Services LSS)

Dewasa ini, data digital telah berkembang dengan sangat pesat. Perkembangan data ini biasanya dipengaruhi oleh jejaring sosial, portal berita online, video online, teknologi kamera digital dan media informasi digital lainnya. Hal ini mengakibatkan teknologi pemrosesan secara konvensional tidak mampu lagi mengolahnya. Untuk itu, diperlukan suatu teknologi seperti Hadoop yang dapat mengolah data dalam jumlah besar. Teknologi ini menggunakan beberapa server yang dapat melakukan proses perhitungan, klasifikasi, data ekstraksi, clustering, dan analisis data lainnya secara paralel. Dalam penelitian ini metode clustering K-Means dan K-Medians dianalisa menggunakan Hadoop. Data yang digunakan adalah data titik 2 dimensi berjumlah 60 juta baris. Ada 4 langkah utama dalam pendekatan yang akan dilakukan, yaitu menginstal Hadoop, mengkonfigurasi Hadoop, membuat data, dan melakukan clustering. Kualitas klaster diukur dengan menggunakan purity dan entropy. Hasil yang diperoleh menunjukkan nilai tertinggi purity adalah 1 dan entropy adalah 0 untuk K-Means dan nilai tertinggi purity adalah 0.988 dan entropy adalah 0.034 untuk K-Medians. Hal ini mengindikasikan bahwa waktu dan kualitas klaster dari metode K-Means lebih baik daripada metode K-Medians pada Data Besar.
Kata kunci : Apache Hadoop, Clustering, K-Means, K-Medians

Abstrak Inggris

Tidak Tersedia Deskripsi

Tulisan Relevan

OPTIMASI HADOOP CLUSTER DENGAN TUNING RNPARAMETER KONFIGURASI (Harits Arunda Achsan, 2023)

ANALISA DATA RETAIL MENGGUNAKAN METODE APRIORI PADA SISTEM TERDISTRIBUSI HADOOP (STEVEN LIUNARDI, 2018)

KLASIFIKASI DATA BESAR ROAD WEATHER INFORMATION STATIONS MENGGUNAKAN NAÏVE BAYESIAN DAN RANDOM FOREST PADA SISTEM TERDISTRIBUSI HADOOP (SYAMSUL KAMAL, 2017)

TEACHING WRITING BY USING CLUSTERING TECHNIQUE FOR JUNIOR HIGH SCHOOL (Endah Anisa Rahma, 2021)

RANCANG BANGUN APLIKASI PENENTUAN LOKASI DAN ESTIMASI JUMLAH ORANG DI DALAM GEDUNG BERBASIS INDOOR LOCALIZATION SYSTEM MENGGUNAKAN ALGORITMA KMEANS (INDRA AZHARI, 2022)

APA Citation Style

Ahli, Amalul .(2018). PERBANDINGAN METODE CLUSTERING K-MEANS DAN K-MEDIANS PADA DATA BESAR MENGGUNAKAN HADOOP. Banda Aceh: FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SYIAH KUALA.

Chicago/Turabian Citation Style

Ahli, Amalul . PERBANDINGAN METODE CLUSTERING K-MEANS DAN K-MEDIANS PADA DATA BESAR MENGGUNAKAN HADOOP. Banda Aceh: FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SYIAH KUALA, 2018.

MLA Citation Style

Ahli, Amalul . PERBANDINGAN METODE CLUSTERING K-MEANS DAN K-MEDIANS PADA DATA BESAR MENGGUNAKAN HADOOP. Banda Aceh: FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SYIAH KUALA, 2018. Print