Electronic Theses and Dissertation
Universitas Syiah Kuala
SKRIPSI
PENGELOMPOKAN DOKUMEN (DOCUMENT CLUSTERING) DENGAN MENGGUNAKAN K-MEANS DAN SINGULAR VALUE DECOMPOSITION (SVD) PADA DATA BLOG
Pengarang
Munzir Umran - Personal Name;
Dosen Pembimbing
Nomor Pokok Mahasiswa
0508101010010
Fakultas & Prodi
Fakultas KIP / Pendidikan Matematika (S1) / PDDIKTI : 84202
Subject
Penerbit
Banda Aceh : Fakultas Matematika dan Ilmu Pengetahuan Alam., 2010
Bahasa
Indonesia
No Classification
519.533
Literature Searching Service
Hard copy atau foto copy dari buku ini dapat diberikan dengan syarat ketentuan berlaku, jika berminat, silahkan hubungi via telegram (Chat Services LSS)
Peningkatan jumlah dokumen dalam format teks yang cukup signifikan belakangan ini, seperti blogs dan website, membuat proses pengelompokan dokumen (document clustering) menjadi semakin penting. Pengelompokan dokumen bertujuan membagi dokumen dalam beberapa kelompok (cluster) sedemikian hingga dokumen-dokumen dalam kelompok yang sarna (intra-cluster) memiliki derajat kesamaan yang tinggi, sementara dokumen-dokumen dalam kelompok yang berbeda (inter-cluster) memiliki derajat kesamaan yang rendah. Tulisan ini mendiskusikan dan memperlihatkan metode pengelompokan dokurnen yang dimulai dengan membangun matriks terms- documents A dan kemudian memecahnya menjadi tiga matriks TSD menggunakan Singular Value Decomposition (SVD). T adalah matriks kata (terms) berukuran t x r, S adalah matriks diagonal berisi nilai skalar (eigen values) berdimensi r x r, dan r ditentukan sebelumnya, D adalah matriks dokumen berukuran r x d. Dekomposisi
nilai singular dari matriks A dinyatakan sebagai A = TSDT.Penelitian dilakukan menggunakan data blog dan dekomposisi matrik menggunakan program General Text Parser (GTP) yang memuat implementasi SVD didalamnya. Selanjutnya,pengelompokan dokumen dilakukan menggunakan k-means dengan k=3,S, dan 7. Hasil menunjukkan babwa dekomposisi matrik terms-documents A dengan Singular Value Decomposion dapat mempercepat proses pengelompokan dokumen karena dimensi dari setiap vektor telah diperkecil tanpa mengurangi arti sebenamya. Namun, karena metode pengelompokan yang digunakan adalab k-means maka hasil pengelompokan sangat sensitif terhadap dokumen yang diduga sebagai outlier. Hasil penelitian, dimensi yang tepat untuk k=3 adalab dimensi 300 dengan persentase optimalnya 100% dan di k=S adalah dimensi 400 dengan persentase optimalnya berada dibatas bawab dari penetapan threshold yaitu 80%. Sedangkan untuk k=7 tidak ada dimensi yang menunjukkan hasil yang bagus karena dari semua dimensi data yang digunakan tidak ada satu pun yang mencukupi batas minimal threshold.
Keywords : Pengelompokan dokumen; Singular Value Decomposition, k-means
Tidak Tersedia Deskripsi
ANALISIS DAN PERBANDINGAN KUALITAS PENGELOMPOKAN DOKUMEN (DOCUMENT CLUSTERING) DENGAN MENGGUNAKAN METODE K-MEANS DAN K-MEDIANS (Bustami, 2022)
PERBANDINGAN METODE FUZZY C-MEANS (FCM) DAN FUZZY GUSTAFSON-KESSEL (FGK) MENGGUNAKAN DATA CITRA SATELIT QUICKBIRD (STUDI KASUS DESA LUBUK BATEE, ACEH BESAR) (Ahmad Mauliyadi Misran, 2022)
VISUALISASI FUZZY CLUSTERING DENGAN MENGGUNAKAN PERANGKAT LUNAK R (Fera Anugreni, 2022)
ANALISA PENGELOMPOKAN PENUNGGAKAN PEMBAYARAN LISTRIK (STUDI KASUS PT. PLN (PERSERO),CABANG MERDUATI BANDA ACEH) (Khusnul Azima, 2015)
PEMANFAATAN TEKNIK DATA MINING DALAM MENGELOMPOKKAN PASIEN LAYAK KEMOTERAPI DI LABORATORIUM BIO-LAB BANDA ACEH BERDASARKAN DATA HASIL TES DARAH (MALAQ AIMANA, 2022)