PERBANDINGAN PERFORMA METODE LDA DAN LSA DALAM MENGANALISIS TOPIK PENELITIAN DOSEN FMIPA, USK | ELECTRONIC THESES AND DISSERTATION

Electronic Theses and Dissertation

Universitas Syiah Kuala

    SKRIPSI

PERBANDINGAN PERFORMA METODE LDA DAN LSA DALAM MENGANALISIS TOPIK PENELITIAN DOSEN FMIPA, USK


Pengarang

Tya Shafira - Personal Name;

Dosen Pembimbing

Viska Mutiawani - 198008312009122003 - Dosen Pembimbing I
Alim Misbullah - 198806032019031011 - Dosen Pembimbing II



Nomor Pokok Mahasiswa

1608107010013

Fakultas & Prodi

Fakultas MIPA / Informatika (S1) / PDDIKTI : 55201

Subject
-
Kata Kunci
-
Penerbit

Banda Aceh : Fakultas MIPA (S1)., 2022

Bahasa

No Classification

-

Literature Searching Service

Hard copy atau foto copy dari buku ini dapat diberikan dengan syarat ketentuan berlaku, jika berminat, silahkan hubungi via telegram (Chat Services LSS)

Jumlah publikasi karya ilmiah mengalami peningkatan yang pesat setiap tahunnya dalam berbagai bidang penelitian. Publikasi ilmiah yang telah dipublikasikan oleh para peneliti dapat diakses secara bebas melalui internet, baik yang disediakan oleh pihak penerbit jurnal, ataupun yang disediakan oleh para penulis jurnal publikasi ilmiah itu sendiri. Publikasi ilmiah yang sudah dipublikasikan ini mengandung berbagai topik
dari hasil penelitian yang telah dilakukan para peneliti. Salah satu cara menemukan topik-topik penelitian tersebut dengan menggunakan analisis Topic modelling. Metode dari topic modelling yang digunakan pada penelitian ini adalah metode Latent Dirichlet Allocation (LDA) dan Latent Semantic Analysis (LSA) yang mana dapat mengelompokkan kata-kata menjadi satu set topik yang terdiri dari keyword penting. Penelitian ini menggunakan dataset data publikasi dosen jurusan Matematika, Informatika dan Statistika dari website Google Scholar yang didapatkan dengan teknik web scraping. Web Scraping digunakan untuk mencari topik-topik penelitian dari sekumpulan data publikasi dosen tersebut yang dibagi dalam dua bahasa yaitu Indonesia dan Inggris. Hasil penelitian ini menunjukkan bahwa metode LDA memiliki hasil yang lebih baik daripada LSA dengan hasil yang didapatkan pada dataset data publikasi bahasa Inggris metode LDA diperoleh coherence score yaitu 0.560191 dengan number of topisc adalah 16 dan dataset data publikasi bahasa Indonesia diperoleh coherence score yaitu 0.465173 dengan number of topics adalah 4. Sedangkan pada metode LSA pada dataset data publikasi bahasa Inggris diperoleh coherence score yaitu 0.430496 dengan number of topics adalah 6 dan dataset data publikasi bahasa Indonesia diperoleh coherence score yaitu 0.465479 dengan number of topics adalah 3.

The number of scientific publications has increased rapidly every year in various research fields. Scientific publications that have been published by researchers can be freely accessed via the internet, either provided by the journal publisher, or by the authors of the scientific publication journal themselves. Scientific publications that have been published contain various topics from the results of research that has been carried out by researchers. One way to find these research topics is by using Topic Modeling analysis. The methods of topic modeling used in this study are the Latent Dirichlet Allocation (LDA) and the Latent Semantic Analysis (LSA) methods which can group words into a set of topics consisting of important keywords. This study used datasets of publications by lecturers of the Mathematics, Informatics and Statistics department from the Google Scholar website which were obtained by using web scraping techniques. Web Scraping used to search for research topics from the lecturer’s publication data which are divided into two languages, Indonesian and English. The results of this study indicate that the LDA method has better results than the LSA with the results obtained in the English publication dataset, the LDA method obtained a coherence score of 0.560191 with the number of topics being 16 and the Indonesian language publication dataset obtained a coherence score of 0.465173 with the number of topics being 4. While the LSA method on the English publication dataset obtained a coherence score of 0.430496 with the number of topics being 6 and the Indonesian language publication dataset obtained a coherence score of 0.465479 with the number of topics being 3.

Citation



    SERVICES DESK