Layanan penulisan ilmiah yang disediakan oleh Perpustakaan Universitas Gunadarma
PERBANDINGAN PERFORMA ALGORITMA KLASIFIKASI NAÏVE BAYES CLASSIFIER DAN SUPPORT VECTOR MACHINE TERHADAP KASUS SENTIMEN PELAKSANAAN PEMILU 2024 MENGGUNAKAN METODE SEMMA
ABSTRAKSI :
Penelitian ini mengambil dan mendokumentasikan data tweet tentang pemilu 2024 menggunakan Python Scraper dengan 24 kata kunci terpilih serta menerapkan metode pelabelan berbasis leksikon untuk mengklasifikasikan tweet ke dalam kategori sentimen positif dan negatif. Metode SEMMA (Sample, Explore, Modify, Model, Assess) diimplementasikan untuk menganalisis sentimen opini masyarakat di Twitter. Data tweet awal yang berjumlah 24.305, setelah dilakukan proses pembersihan mengalami penyusutan menjadi 20.480. Data ini nantinya yang akan digunakan dalam proses analisis. Hasil pelabelan menunjukkan 78% yaitu 15.993 tweet mengandung sentimen negatif, sedangkan 21,9% lainnya yaitu 4.487 tweet mengandung bersentimen positif. Support Vector Machine (SVM) dalam hal kinerja menunjukkan tingkat akurasi yang lebih tinggi jika dibandingkan dengan Naive Bayes, pada ketiga skenario pembagian data, dengan nilai tertinggi mencapai 0.918 pada pembagian data 85:15. Sebaliknya, Naive Bayes secara konsisten memiliki akurasi lebih rendah, dengan nilai tertinggi 0.801 pada pembagian data 55:45 dan terendah 0.797 pada pembagian data 85:15. Secara keseluruhan, SVM direkomendasikan sebagai algoritma yang lebih efektif untuk analisis sentimen pada tweet terkait pemilu 2024, memberikan kontribusi yang signifikan terhadap pemahaman sentimen publik dan pengambilan keputusan berbasis data.