Posted on June 23, 2022, 6:49 p.m.

Pada tanggal 15 Juni 2022, Tokopedia-UI AI Center of Excellence bersama Laboratorium IR-NLP menyelenggarakan acara kolaborasi dengan mengundang Dr. Kurniawati Azizah, S.T., M.Phil., staf pengajar Fasilkom UI, sebagai pembicara utama pada webinar bulan ini dengan topik “Hierarchical Transfer Learning for Deep Learning-based Text-to-Speech on Low-Resource Languages”. Kegiatan ini berlangsung secara daring melalui platform Zoom. Acara ini dimulai dengan sambutan Arlisa Yuliawati, S.Kom., M.Kom selaku moderator dan dilanjutkan dengan penjelasan profil singkat tentang pembicara. Tujuan dari diselenggarakannya acara ini yaitu peserta dapat memahami bagaimana implementasi transfer learning dengan deep learning dalam text-to-speech terkhususnya pada bahasa daerah di Indonesia.

Sesi talk series ini diawali dengan pembahasan secara umum terkait problem yang ada pada domain Natural Language Processing (NLP) yang dapat terbagi menjadi Natural Language Understanding (NLU) dan Natural Language Generation. TTS atau text-to-speech merupakan salah satu cabang NLP yang mempelajari bagaimana komputer atau mesin dapat membaca text dan mengucapkannya secara otomatis. Perkembangan klasifikasi TTS dapat dibagi menjadi empat yaitu rule-based, sample-based, model-based SPSS, dan model-based BPSS. Dalam paparannya, beliau juga menyampaikan terkait state-of-the-art dari model TTS dengan deep learning yang digunakan sebagai tolok ukur dalam penelitian pada bahasa dengan sumber daya rendah. Pada penelitiannya, Ibu Kurniawati mengusulkan strategi untuk membangun suatu model yang dapat membuat TTS dengan bahasa low-resource terkhususnya bahasa indonesia, bahasa jawa, dan bahasa sunda menggunakan deep transfer learning dari Tacotron 2. Dari hasil riset, beliau berhasil mengembangkan model yang mendekati state-of-the-art dan ground truth untuk monolingual single speaker dengan nilai evaluasi MOS sebesar 4.271 untuk bahasa indonesia, 4.077 untuk bahasa jawa, dan 3.920 untuk bahasa sunda. Sedangkan untuk nilai evaluasi SUS sebesar 98.26% untuk bahasa indonesia, 95.02% untuk bahasa jawa, dan 95.43% untuk bahasa sunda. Selain itu, untuk skema multilingual multi-speaker dan zero-shot multilingual multi-speaker juga dikembangkan dengan memanfaatkan arsitektur yang sama yaitu partial network-based deep transfer learning.

Setelah sesi materi selesai, para partisipan dipersilakan untuk mengajukan pertanyaan. Sebagai penutup, acara ini diakhiri dengan sesi foto bersama.

Link YouTube: https://youtu.be/vdEHLmaWrIw

Artificial Intelligence/Machine Learning Natural Language Processing