PERBANDINGAN METODE CLUSTERING K-MEANS DAN K-MEDIANS PADA DATA BESAR MENGGUNAKAN HADOOP | ELECTRONIC THESES AND DISSERTATION

Electronic Theses and Dissertation

Universitas Syiah Kuala

    SKRIPSI

PERBANDINGAN METODE CLUSTERING K-MEANS DAN K-MEDIANS PADA DATA BESAR MENGGUNAKAN HADOOP


Pengarang

Amalul Ahli - Personal Name;

Dosen Pembimbing



Nomor Pokok Mahasiswa

1308107010006

Fakultas & Prodi

Fakultas MIPA / Informatika (S1) / PDDIKTI : 55201

Penerbit

Banda Aceh : FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SYIAH KUALA., 2018

Bahasa

Indonesia

No Classification

1

Literature Searching Service

Hard copy atau foto copy dari buku ini dapat diberikan dengan syarat ketentuan berlaku, jika berminat, silahkan hubungi via telegram (Chat Services LSS)

Dewasa ini, data digital telah berkembang dengan sangat pesat. Perkembangan data ini biasanya dipengaruhi oleh jejaring sosial, portal berita online, video online, teknologi kamera digital dan media informasi digital lainnya. Hal ini mengakibatkan teknologi pemrosesan secara konvensional tidak mampu lagi mengolahnya. Untuk itu, diperlukan suatu teknologi seperti Hadoop yang dapat mengolah data dalam jumlah besar. Teknologi ini menggunakan beberapa server yang dapat melakukan proses perhitungan, klasifikasi, data ekstraksi, clustering, dan analisis data lainnya secara paralel. Dalam penelitian ini metode clustering K-Means dan K-Medians dianalisa menggunakan Hadoop. Data yang digunakan adalah data titik 2 dimensi berjumlah 60 juta baris. Ada 4 langkah utama dalam pendekatan yang akan dilakukan, yaitu menginstal Hadoop, mengkonfigurasi Hadoop, membuat data, dan melakukan clustering. Kualitas klaster diukur dengan menggunakan purity dan entropy. Hasil yang diperoleh menunjukkan nilai tertinggi purity adalah 1 dan entropy adalah 0 untuk K-Means dan nilai tertinggi purity adalah 0.988 dan entropy adalah 0.034 untuk K-Medians. Hal ini mengindikasikan bahwa waktu dan kualitas klaster dari metode K-Means lebih baik daripada metode K-Medians pada Data Besar.
Kata kunci : Apache Hadoop, Clustering, K-Means, K-Medians

Tidak Tersedia Deskripsi

Citation



    SERVICES DESK