Electronic Theses and Dissertation

Universitas Syiah Kuala

SKRIPSI

PENGELOMPOKAN DOKUMEN (DOCUMENT CLUSTERING) DENGAN MENGGUNAKAN K-MEANS DAN SINGULAR VALUE DECOMPOSITION (SVD) PADA DATA BLOG

Pengarang

Munzir Umran - Personal Name;

Dosen Pembimbing

Nomor Pokok Mahasiswa

0508101010010

Fakultas & Prodi

Fakultas KIP / Pendidikan Matematika (S1) / PDDIKTI : 84202

Subject

MEANS - STATISTICAL MATHEMATICS

Kata Kunci

PENGELOMPOKAN DOKUMEN
SINGULAR VALUE DECOMPOSITION
DATA BLOG

Penerbit

Banda Aceh : Fakultas Matematika dan Ilmu Pengetahuan Alam., 2010

Bahasa

Indonesia

No Classification

519.533

Literature Searching Service

Hard copy atau foto copy dari buku ini dapat diberikan dengan syarat ketentuan berlaku, jika berminat, silahkan hubungi via telegram (Chat Services LSS)

Peningkatan jumlah dokumen dalam format teks yang cukup signifikan belakangan ini, seperti blogs dan website, membuat proses pengelompokan dokumen (document clustering) menjadi semakin penting. Pengelompokan dokumen bertujuan membagi dokumen dalam beberapa kelompok (cluster) sedemikian hingga dokumen-dokumen dalam kelompok yang sarna (intra-cluster) memiliki derajat kesamaan yang tinggi, sementara dokumen-dokumen dalam kelompok yang berbeda (inter-cluster) memiliki derajat kesamaan yang rendah. Tulisan ini mendiskusikan dan memperlihatkan metode pengelompokan dokurnen yang dimulai dengan membangun matriks terms- documents A dan kemudian memecahnya menjadi tiga matriks TSD menggunakan Singular Value Decomposition (SVD). T adalah matriks kata (terms) berukuran t x r, S adalah matriks diagonal berisi nilai skalar (eigen values) berdimensi r x r, dan r ditentukan sebelumnya, D adalah matriks dokumen berukuran r x d. Dekomposisi
nilai singular dari matriks A dinyatakan sebagai A = TSDT.Penelitian dilakukan menggunakan data blog dan dekomposisi matrik menggunakan program General Text Parser (GTP) yang memuat implementasi SVD didalamnya. Selanjutnya,pengelompokan dokumen dilakukan menggunakan k-means dengan k=3,S, dan 7. Hasil menunjukkan babwa dekomposisi matrik terms-documents A dengan Singular Value Decomposion dapat mempercepat proses pengelompokan dokumen karena dimensi dari setiap vektor telah diperkecil tanpa mengurangi arti sebenamya. Namun, karena metode pengelompokan yang digunakan adalab k-means maka hasil pengelompokan sangat sensitif terhadap dokumen yang diduga sebagai outlier. Hasil penelitian, dimensi yang tepat untuk k=3 adalab dimensi 300 dengan persentase optimalnya 100% dan di k=S adalah dimensi 400 dengan persentase optimalnya berada dibatas bawab dari penetapan threshold yaitu 80%. Sedangkan untuk k=7 tidak ada dimensi yang menunjukkan hasil yang bagus karena dari semua dimensi data yang digunakan tidak ada satu pun yang mencukupi batas minimal threshold.

Keywords : Pengelompokan dokumen; Singular Value Decomposition, k-means

Abstrak Inggris

Tidak Tersedia Deskripsi

Tulisan Relevan

ANALISIS DAN PERBANDINGAN KUALITAS PENGELOMPOKAN DOKUMEN (DOCUMENT CLUSTERING) DENGAN MENGGUNAKAN METODE K-MEANS DAN K-MEDIANS (Bustami, 2022)

PENGKAJIAN JUMLAH DIMENSI MATRIKS SINGULAR DALAM SINGULAR VALUE DECOMPOSITION (SVD) UNTUK KASUS SINONIM BERBAHASA INDONESIA (Cut Yanti, 2022)

PERBANDINGAN METODE FUZZY C-MEANS (FCM) DAN FUZZY GUSTAFSON-KESSEL (FGK) MENGGUNAKAN DATA CITRA SATELIT QUICKBIRD (STUDI KASUS DESA LUBUK BATEE, ACEH BESAR) (Ahmad Mauliyadi Misran, 2022)

VISUALISASI FUZZY CLUSTERING DENGAN MENGGUNAKAN PERANGKAT LUNAK R (Fera Anugreni, 2022)

PEMANFAATAN TEKNIK DATA MINING DALAM MENGELOMPOKKAN PASIEN LAYAK KEMOTERAPI DI LABORATORIUM BIO-LAB BANDA ACEH BERDASARKAN DATA HASIL TES DARAH (MALAQ AIMANA, 2022)

APA Citation Style

Umran, Munzir .(2010). PENGELOMPOKAN DOKUMEN (DOCUMENT CLUSTERING) DENGAN MENGGUNAKAN K-MEANS DAN SINGULAR VALUE DECOMPOSITION (SVD) PADA DATA BLOG. Banda Aceh: Fakultas Matematika dan Ilmu Pengetahuan Alam.

Chicago/Turabian Citation Style

Umran, Munzir . PENGELOMPOKAN DOKUMEN (DOCUMENT CLUSTERING) DENGAN MENGGUNAKAN K-MEANS DAN SINGULAR VALUE DECOMPOSITION (SVD) PADA DATA BLOG. Banda Aceh: Fakultas Matematika dan Ilmu Pengetahuan Alam, 2010.

MLA Citation Style