Layanan penulisan ilmiah yang disediakan oleh Perpustakaan Universitas Gunadarma
PERBANDINGAN METODE LINEAR REGRESSION DAN DECISION TREE REGRESSION DENGAN DATASET UBER VS LYFT
ABSTRAKSI :
Perkembangan teknologi informasi dan arus data yang cepat memerlukan pengelolaan yang tepat untuk menghasilkan pengetahuan yang relevan untuk pengambilan keputusan, salah satunya yaitu dengan data mining. Data mining memiliki teknik yang bernama regresi dengan beberapa metode di dalamnya. Penelitian ini akan berfokus pada 2 metode saja, yaitu Linear Regression dan Decision Tree Regression, sesuai dengan tujuan dari penelitian ini, yaitu untuk mengetahui bagaimana cara mengimplementasikan model Linear Regression dan Decision Tree Regression serta mengetahui model mana yang lebih baik untuk memprediksi harga transportasi online sesuai dataset yang telah disiapkan yaitu dataset dari Uber vs Lyft. Metode yang digunakan dalam penelitian adalah Cross Industry Standard Process for Data Mining (CRISP-DM). CRISP-DM memiliki beberapa tahapan, yaitu Pemahaman Bisnis, Pemahaman Data, Persiapan Data, Permodelan, Evaluasi, dan Penyebaran. Hasil pengujian akurasi pada model Linear Regression berturut – turut dalam tiga rasio, yaitu 70:30, 75:25, dan 80:20 adalah 52.32%, 52.36%, 52.32% sedangkan hasil akurasi dari model Decision Tree Regression adalah 94.58%, 94.61%, 94.67%. Hasil perbandingan nilai Root Mean Square Error (RMSE) dan Mean Absolute Error (MAE) pada model Linear Regression adalah 14.5194 dan 11.7207 serta untuk model Decision Tree Regression adalah 4.8600 dan 2.9052. Kesimpulan yang didapat adalah model Decision Tree Regression memiliki akurasi lebih besar serta nilai RMSE dan MAE lebih kecil daripada model Linear Regression. Hal ini menunjukkan bahwa model Decision Tree Regression memiliki performa lebih baik dibanding model Linear Regression dalam hal memprediksi harga transportasi online.