Layanan penulisan ilmiah yang disediakan oleh Perpustakaan Universitas Gunadarma
PENGGUNAAN TRITON UNTUK GENERATIVE AI BERBASIS LARGE LANGUAGE MODEL
ABSTRAKSI :
Harun Arif. 52419757 PENGGUNAAN TRITON UNTUK GENERATIVE AI BERBASIS LARGE LANGUAGE MODEL. Skripsi, Fakultas Teknologi Industri, Jurusan Informatika, Universitas Gunadarma, 2023. (x+47+ Lampiran) Kata Kunci : Triton Inference Server, ResNet50, Inferensi Model, Confidence Score, Classification Index, Cross-Industry Standard Process for Data Mining (CRISP-DM) Penelitian ini membahas penggunaan Triton Inference Server untuk mengelola dan melakukan inferensi pada model ResNet50, sebuah Convolutional Neural Network (CNN) dalam konteks perkembangan Generative AI dan Large Language Model. Tujuan utama penelitian ini adalah untuk merancang proses deployment dan melakukan inferensi pada model ResNet50 menggunakan Triton Inference Server. Penelitian ini bertujuan menghasilkan nilai klasifikasi dari model ResNet50 terhadap gambar dengan 1000 prediksi, dalam format confidence_score dan classification_index. Metode penelitian ini mengadaptasi Cross-Industry Standard Process for Data Mining (CRISPDM) sebagai kerangka kerja untuk mengelola proyek analisis data secara sistematis. Penelitian menggunakan metode CRISP-DM dalam semua tahap, dari pemahaman awal hingga implementasi hasil analisis. Hasil penelitian menunjukkan bahwa Triton Inference Server sangat membantu dalam meningkatkan efisiensi dan efektivitas proses inferensi model ResNet50, terutama ketika menjalankannya pada GPU. Proses inferensi 1000 prediksi pada 10 gambar membutuhkan waktu rata-rata hanya 0,029 detik. Penelitian ini memberikan kontribusi penting dalam pengelolaan model-model besar dalam AI, khususnya dalam pengolahan citra. Daftar Pustaka (2006-2023)