ABSTRAKSI :
Yandi Eko Testiono, 92215064. “PENERAPAN HADOOP FRAMEWORK PADA PENGELOLAAN BIG DATA ARSIP NASIONAL RI.†Thesis. Program Pascasarjana, Universitas Gunadarma, 2017. Kata Kunci: Big Data, Hadoop Framework, Volume, Variety, dan Velocity. (xv + 114 + Lampiran) Teknologi Big Data merupakan suatu manajemen aset informasi dengan volume yang tinggi, dan kompleks yang membantu perusahaan dalam melakukan pengelolaan data dengan biaya yang efektif, dan sebagai pengambilan keputusan. Big Data menjamin pemrosesan solusi data dengan beberapa varian yang baru maupun eksisting untuk memberikan manfaat yang nyata dalam dunia bisnis. Penelitian ini bertujuan untuk memecahkan masalah pada Instansi Arsip Nasional RI dalam menangani jumlah data yang besar (Volume), pertumbuhan data yang cepat (Velocity), dan bentuk format yang beraneka ragam (Variety) pada saat pengolahan data kearsipan. Metode pada penelitian ini melakukan pendekatan melalui Hadoop framework, dan berdasarkan literatur jurnal yang terkait. Hasil dari penelitian ini menjelaskan implementasi Hadoop single node menggunakan dua metode yaitu implementasi manual, dan implementasi menggunakan layanan Big Data Hadoop. Metode pertama yaitu implementasi manual menggunakan metode â€Cygwin, VMWare, Eclipse,Web Browserâ€, dan metode â€Command Prompt, Web Browserâ€. Metode kedua yaitu menggunakan layanan Big Data Hadoop menggunakan Cloudera. Penelitian ini membuktikan implementasi Big Data telah menjawab permasalahan yang terjadi di Institusi Arsip Nasional RI, diantaranya permasalahan penyimpanan (storage), dan Disaster Recovery Plan. Hal ini dikarenakan Hadoop mempunyai manajemen dan operasional yang terstrukur yang disediakan dalam bentuk layanan platform yang bersifat terbuka dan terintegrasi yang memberikan opsi penyimpanan dan komputansi yang terjangkau bila dilihat dari segi biaya dan efisiensi. Selain itu Hadoop juga menyediakan fitur Disaster Recovery Plan dalam bentuk layanan Cloudera, yang memungkinkan untuk replikasi data di seluruh pusat data. Replikasi ini mencakup data-data yang tersimpan di dalam HDFS, data dalam tabel Hive, metadata Impala yang terdaftar di metastore Hive. Saat data penting disimpan di HDFS, Cloudera Manager membantu memastikan data tersedia setiap saat, bahkan ketika terjadi pemberhentian di pusat data. Daftar Pustaka (2009 - 2016)
PEMBIMBING :
Dyah Cita Irawati, Dr., MM., S.Si