Posted on Jan. 22, 2022, 4:20 a.m.
Pada tanggal 20 Januari 2022, Tokopedia UI AI Center of Excellence menyelenggarakan acara mini workshop bertemakan “Artificial Intelligence in Text Mining” yang dilaksanakan secara daring dengan menggunakan platform Zoom Meeting. Salah satu asisten riset dari Tokopedia UI AI Center of Excellence, Douglas Raevan Faisal, S.Kom. merupakan pembicara utama dari acara mini workshop ini.
Acara mini workshop dimulai oleh Bapak Fariz Darari, Ph.D. selaku moderator dan Co-director dari Tokopedia UI AI Center of Excellence. Tujuan dari diselenggarakannya acara ini antara lain peserta dapat memahami bagaimana proses dalam melakukan Text Mining, pemanfaatan AI dalam Text Mining, serta performa High Performance Computer yang dapat membantu komputasi riset di bidang AI terkhususnya text mining. Selain itu, peserta diharapkan dapat memahami pemanfaatan AI untuk menyelesaikan problem pada text mining serta resource HPC seperti DGX-1 dan DGX-A100 di Fasilkom untuk membantu menyelesaikan riset.
Sesi pertama dalam mini workshop ini membahas tentang text mining secara umum. Beberapa penerapan text mining yang ditemui dalam kehidupan sehari-hari adalah spam detection, dan sentiment analysis. Adapun teknik yang dapat digunakan dalam melakukan text mining juga dijelaskan seperti teknik tradisional seperti feature engineering dilanjutkan dengan prediksi dan teknik deep learning seperti CNN, RNN, Transformer, dan BERT.
Sesi kedua dari mini workshop membahas terkait high performance computer yaitu GPU/TPU accelerated machine learning, pengetahuan umum dan setup HPC di AI Center yang meliputi DGX-1 dan DGX-A100, serta HPC untuk text mining. Setelah itu, kegiatan dilanjutkan dengan hands-on terkait klasifikasi sentimen pada data ulasan film di IMDb dengan memanfaatkan teknik tradisional dengan memanfaatkan algoritma klasifikasi naive bayes dan deep learning dengan model BERT. Teknik-teknik yang digunakan cukup mudah untuk digunakan bagi peserta yang belum memiliki pengetahuan di bidang text mining. Selain itu, ditunjukkan perbandingan runtime antara penggunaan GPU dari Google Colab dan DGX-1 untuk melakukan training model BERT. Output dari hands-on yang dilakukan adalah peserta dari acara mini workshop ini mampu untuk melakukan klasifikasi sentimen dan cara menggunakan resource DGX-1.
Link PPT : s.id/SlidesTextMiningWorkshop
Link Video : s.id/VideoTextMiningWorkshop
uncategorized