Posted on May 5, 2023, 7:57 a.m.

Tokopedia UI AI Center of Excellence kembali menggelar acara AI Talk Series dengan tema “Introduction of Big Data Analytics” yang menghadirkan Denny, Ph.D. selaku Direktur di Pusilkom UI sebagai pembicara utama (03/05/2023). Pusilkom UI merupakan unit ventura akademik di bawah naungan Fasilkom UI yang memiliki tujuan untuk mengembangkan kompetensi dan keterampilan Ilmu Komputer di masyarakat dengan beberapa layanan utama yaitu, pelatihan rutin dan/atau short course terkait AI/IT/IS, in-house training, workshop, konsultasi, maupun development program.

Adapun kegiatan ini berlangsung secara daring melalui platform Zoom dan dimulai dengan sambutan Bapak Fariz Darari, Ph.D selaku Co-Direktur Tokopedia-UI Artificial Intelligence Center of Excellence dan penjelasan profil singkat tentang pembicara. Tujuan diselenggarakan dari acara ini adalah memberikan pemahaman terkait apa itu big data analytics dan bagaimana implementasi terkait penggunaan teknologinya dalam menyelesaikan beberapa contoh kasus.

Sesi talk series ini diawali dengan membahas contoh kasus big data yang ada terkait fitur pick point dalam aplikasi milik salah satu perusahaan di Indonesia, yaitu Gojek. Dari pertumbuhan data transaksi yang semakin banyak, maka diperlukan sistem otomasi yang mampu mengolah pick point untuk membantu customer dan driver. Proses pengolahan yang bersifat data-driven inilah yang diperlukan seperti melakukan clustering guna menemukan kumpulan points yang memiliki pattern yang sama. Dari sini dapat diketahui bahwa big data dapat didefinisikan sebagai suatu volume besar yang terdiri dari data terstruktur dan tidak terstruktur yang sulit untuk diproses menggunakan teknik database dan software tradisional yang melampaui kapasitas proses dari suatu mesin/service agar mampu memperbaiki operasi lebih cepat dan decision yang bersifat intelligent. Secara umum, big data terdiri data transaksi, interaksi, observasi, dan external data (social media). Sedangkan secara karakteristik, big data dapat dilihat dari tiga sifat yaitu volume, velocity, dan veracity. Dalam paparannya, big data memiliki lima tahapan dalam pipelinenya yang meliputi 1) capture, 2) ingest, 3) store, 4) compute, dan 5) use.

Materi dilanjutkan dengan penjelasan terkait aplikasi big data yang diketahui memiliki beberapa karakteristik yaitu a) data throttling, b) computation-restricted throttling, c) large data volumes, d) significant data variety, dan e) benefits from data parallelization. Selain itu, dijelaskan pula terkait infrastruktur big data yang ada di Fasilkom dimana core system menggunakan hadoop serta proyek sound intrusion. Dalam penjelasannya, hadoop memiliki dua sistem utama yaitu a) YARN/MapReduce yang merupakan distributed big data processing infrastructure (abstract/paradigm, fault-tolerant, schedule, execution) serta b) HDFS dengan fitur highly fault-tolerant, menggunakan replika, dan throughput yang tinggi. 

Setelah sesi materi selesai, para partisipan dipersilakan untuk mengajukan pertanyaan dan disambut secara antusias dan sesi acara diakhiri dengan foto bersama.

Talk Series Big Data