Dewasa ini, data digital telah berkembang dengan sangat pesat. perkembangan data ini biasanya dipengaruhi oleh jejaring sosial, portal berita online, video online, teknologi kamera digital dan media informasi digital lainnya. hal ini mengakibatkan teknologi pemrosesan secara konvensional tidak mampu lagi mengolahnya. untuk itu, diperlukan suatu teknologi seperti hadoop yang dapat mengolah data dalam jumlah besar. teknologi ini menggunakan beberapa server yang dapat melakukan proses perhitungan, klasifikasi, data ekstraksi, clustering, dan analisis data lainnya secara paralel. dalam penelitian ini metode clustering k-means dan k-medians dianalisa menggunakan hadoop. data yang digunakan adalah data titik 2 dimensi berjumlah 60 juta baris. ada 4 langkah utama dalam pendekatan yang akan dilakukan, yaitu menginstal hadoop, mengkonfigurasi hadoop, membuat data, dan melakukan clustering. kualitas klaster diukur dengan menggunakan purity dan entropy. hasil yang diperoleh menunjukkan nilai tertinggi purity adalah 1 dan entropy adalah 0 untuk k-means dan nilai tertinggi purity adalah 0.988 dan entropy adalah 0.034 untuk k-medians. hal ini mengindikasikan bahwa waktu dan kualitas klaster dari metode k-means lebih baik daripada metode k-medians pada data besar. kata kunci : apache hadoop, clustering, k-means, k-medians
Electronic Theses and Dissertation
Universitas Syiah Kuala
SKRIPSI
PERBANDINGAN METODE CLUSTERING K-MEANS DAN K-MEDIANS PADA DATA BESAR MENGGUNAKAN HADOOP. Banda Aceh FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SYIAH KUALA,2018
Baca Juga : PENGELOMPOKAN SMA/MA JURUSAN IPA DI PROVINSI ACEH MENGGUNAKAN METODE K-MEANS DAN K-MEDIANS (NURUL HUSNA, 2018)
Abstract
Baca Juga : ANALISA DATA RETAIL MENGGUNAKAN METODE APRIORI PADA SISTEM TERDISTRIBUSI HADOOP (STEVEN LIUNARDI, 2018)