Universitas Syiah Kuala | ELECTRONIC THESES AND DISSERTATION

Electronic Theses and Dissertation

Universitas Syiah Kuala

    SKRIPSI
Fatiya Humaira Yunaz, PEMBANGKITAN TEKS HUMOR BERBAHASA INDONESIA MENGGUNAKAN MODEL GENERATIVE ARTIFICIAL INTELLIGENCE. Banda Aceh Fakultas MIPA (S1),2025

Pembangkitan teks humor adalah salah satu tugas dalam pemrosesan bahasa alami (nlp) yang bertujuan untuk menghasilkan teks humor yang sesuai dengan topik yang diinginkan pengguna. penggunaan generative artificial intelligence (genai), seperti model generative pre-trained transformer (gpt), memungkinkan pembangkitan teks humor yang lebih kreatif dan alami. perbandingan dilakukan antara model gpt- neo dan gpt-2 dalam melakukan pembangkitan teks humor berbahasa indonesia. dataset teks humor berbahasa indonesia dikumpulkan melalui teknik web scraping dari komentar-komentar youtube, yang kemudian digunakan untuk melatih model dalam menghasilkan teks humor yang relevan dengan topik yang diberikan oleh pengguna. eksperimen membandingkan kedua model menggunakan metrik evaluasi otomatis seperti bleu, rouge-1, dan rouge-l, serta human evaluation terkait kelucuan dan naturalness. hasil eksperimen menunjukkan bahwa gpt-neo unggul dalam metrik otomatis, sementara gpt-2 lebih unggul dalam menghasilkan humor yang lebih lucu dan sesuai dengan harapan pengguna berdasarkan human evaluation. model gpt-neo memperoleh bleu 0,1205, rouge-1 0,1928, dan rouge-l 0,1532. model gpt-2 memperoleh readability 67%, clarity 66%, general appropriateness 63%, serta tingkat kelucuan 62%. diimplementasikan sistem pembangkit teks humor berbasis web menggunakan streamlit, memungkinkan pengguna untuk memilih model dan memasukkan topik humor yang diinginkan.



Abstract

Humor generation is a task in Natural Language Processing (NLP) aimed at producing humorous text based on a user-defined topic. The use of Generative Artificial Intelligence (GenAI), such as the Generative Pre-trained Transformer (GPT) model, enables the creation of more creative and natural humor. A comparison was made between the GPT-Neo and GPT-2 models in generating humor in the Indonesian language. The Indonesian humor dataset was collected using web scraping from YouTube comments, which was then used to train the models to produce relevant humorous text based on user-defined topics. Experiments were conducted to compare the models using automatic evaluation metrics such as BLEU, ROUGE-1, and ROUGE-L, as well as human evaluation related to humor quality and naturalness. The results showed that GPT-Neo performed better in automatic metrics, while GPT-2 excelled in generating humor that was funnier and more in line with user expectations based on human evaluation. The GPT-Neo model achieved BLEU 0.1205, ROUGE-1 0.1928, and ROUGE-L 0.1532. The GPT-2 model achieved readability 67%, clarity 66%, general appropriateness 63%, and humor level 62%. A web-based humor generation system using Streamlit was implemented, allowing users to select the model and input their desired humor topic.



    SERVICES DESK