Universitas Syiah Kuala | ELECTRONIC THESES AND DISSERTATION

Dewasa ini, data digital telah berkembang dengan sangat pesat. perkembangan data ini biasanya dipengaruhi oleh jejaring sosial, portal berita online, video online, teknologi kamera digital dan media informasi digital lainnya. hal ini mengakibatkan teknologi pemrosesan secara konvensional tidak mampu lagi mengolahnya. untuk itu, diperlukan suatu teknologi seperti hadoop yang dapat mengolah data dalam jumlah besar. teknologi ini menggunakan beberapa server yang dapat melakukan proses perhitungan, klasifikasi, data ekstraksi, clustering, dan analisis data lainnya secara paralel. dalam penelitian ini metode clustering k-means dan k-medians dianalisa menggunakan hadoop. data yang digunakan adalah data titik 2 dimensi berjumlah 60 juta baris. ada 4 langkah utama dalam pendekatan yang akan dilakukan, yaitu menginstal hadoop, mengkonfigurasi hadoop, membuat data, dan melakukan clustering. kualitas klaster diukur dengan menggunakan purity dan entropy. hasil yang diperoleh menunjukkan nilai tertinggi purity adalah 1 dan entropy adalah 0 untuk k-means dan nilai tertinggi purity adalah 0.988 dan entropy adalah 0.034 untuk k-medians. hal ini mengindikasikan bahwa waktu dan kualitas klaster dari metode k-means lebih baik daripada metode k-medians pada data besar. kata kunci : apache hadoop, clustering, k-means, k-medians

Electronic Theses and Dissertation

Detail Abstract

SKRIPSI

Amalul Ahli, PERBANDINGAN METODE CLUSTERING K-MEANS DAN K-MEDIANS PADA DATA BESAR MENGGUNAKAN HADOOP. Banda Aceh FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SYIAH KUALA,2018

Abstract