Layanan penulisan ilmiah yang disediakan oleh Perpustakaan Universitas Gunadarma
IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI CUSTOMER CHURN PADA PLATFORM E-COMMERCE
ABSTRAKSI :
Perusahaan dengan tingkat churn tinggi dapat berdampak buruk pada bisnis yang dikelolanya. Penelitian ini bertujuan membuat model pembelajaran mesin untuk memprediksi pelanggan churn di e-commerce dan mengidentifikasi fitur-fitur di dalam dataset yang berpengaruh signifikan terhadap probabilitas potensi churn. Metode penelitian yang digunakan adalah CRISP-DM, meliputi Pemahaman Bisnis, Pemahaman Data, Persiapan Data, Pemodelan, dan Evaluasi. Tiga algoritma klasifikasi yang diterapkan, yaitu Gradient Boosting Classifier, XGBoost, dan CatBoost Classifier. Evaluasi dilakukan pada berbagai periode waktu pengujian dan XGBoost dipilih sebagai model terbaik karena memiliki nilai AUC yang berada di rentang 0.87 hingga 0.90 menunjukkan bahwa model ini dapat membedakan kelas positif (churn) dan kelas negatif (non-churn) dengan performa yang baik, memiliki metrik recall yang paling tinggi dan jumlah false negative yang paling sedikit dibandingkan dengan algoritma lainnya menunjukkan bahwa XGBoost lebih baik dalam mengidentifikasi sebagian besar pelanggan yang benar-benar churn di e-commerce, serta nilai metrik-metrik yang cenderung stabil menunjukkan model mampu menangani pola atau perubahan tren di dalam dataset e-commerce dengan performa cukup baik di berbagai periode waktu pengujian. Hasil penelitian menunjukkan bahwa fitur yang paling berpengaruh signifikan terhadap probabilitas potensi pelanggan churn berdasarkan hasil feature importance dari XGBoost, yaitu frequency, recency, dan monetary.