REPOSITORY

Layanan penulisan ilmiah yang disediakan oleh Perpustakaan Universitas Gunadarma

PERBANDINGAN KINERJA MODEL BERTSUMEXT DENGAN BASELINE LEAD-3 UNTUK PERINGKASAN TEKS OTOMATIS BAHASA INGGRIS DAN BAHASA INDONESIA DENGAN PYTHON

ABSTRAKSI :
Peningkatan jumlah informasi digital mendorong kebutuhan akan sistem Automatic Text Summarization (ATS) yang mampu menyajikan ringkasan secara ringkas dan informatif. Penelitian ini bertujuan untuk membandingkan kinerja dua pendekatan ekstraktif, yaitu baseline sederhana Lead-3 dan model modern BERTSumExt berbasis Transformer, dengan menggukanan Python dalam merangkum teks berbahasa Inggris dan Bahasa Indonesia. Dataset yang digunakan adalah CNN/DailyMail sebagai representasi teks semi-abstraktif berbahasa Inggris dan IndoSum sebagai dataset standar berbahasa Indonesia yang bersifat ekstraktif. Tahapan penelitian mencakup pra-pemrosesan teks, strategi pelabelan (fuzzy matching untuk CNN/DailyMail dan exact matching untuk IndoSum), implementasi metode, pelatihan terbatas, serta evaluasi menggunakan metrik ROUGE. Hasil eksperimen menunjukkan bahwa pada CNN/DailyMail, Lead-3 memperoleh skor ROUGE-1 sebesar 0,2921, ROUGE-2 sebesar 0,1117, dan ROUGE-L sebesar 0,1915, lebih tinggi dibandingkan BERTSumExt yang hanya mencapai ROUGE-1 sebesar 0,2388, ROUGE-2 sebesar 0,0569, dan ROUGE-L sebesar 0,1427. Pada IndoSum, perbedaan semakin jelas, dengan Lead-3 mencapai ROUGE-1 sebesar 0,6687, ROUGE-2 sebesar 0,6046, dan ROUGE-L sebesar 0,6515, sedangkan BERTSumExt tertinggal dengan ROUGE-1 sebesar 0,3327, ROUGE-2 sebesar 0,1822, dan ROUGE-L sebesar 0,2442. Temuan ini menegaskan bahwa efektivitas model sangat dipengaruhi oleh karakteristik dataset; metode sederhana seperti Lead-3 lebih efektif pada dataset ekstraktif, sementara BERTSumExt tetap menawarkan fleksibilitas semantik pada dataset semi-abstraktif meskipun belum melampaui baseline. Penelitian ini berkontribusi dengan menghadirkan studi komparatif lintas bahasa mengenai efektivitas metode ekstraktif sederhana dan modern dalam peringkasan teks otomatis. Daftar Pustaka (2017-2025)
NOMOR INDUK :
FTI/IA/SKRIPSI/3446/2025
PEMBIMBING :
Hurnaningsih, SKom.,MM
TANGGAL SIDANG :
20/09/2025
TANGGAL PENYERAHAN :
10/11/2025
JENIS PENULISAN :
SKRIPSI
BERKAS PENULISAN
COVER PENULISAN
PERNYATAAN ORIGINALITAS & PUBLIKASI
PARAF & STEMPEL LEMBAR PENGESAHAN
ABSTRAKSI (BAHASA INDONESIA)
ABSTRAKSI (BAHASA INGGRIS)
KATA PENGANTAR
DAFTAR ISI
DAFTAR TABEL
DAFTAR GAMBAR
BAB I
BAB II
BAB III
BAB IV
BAB V
DAFTAR PUSTAKA
LISTING PROGRAM
DOKUMEN PRESENTASI SIDANG
JURNAL
OUTPUT PROGRAM
JURNAL WORD (.doc/.docx)