Resume Artikel Ilmiah “LUMINA: Linguistic unified multimodal Indonesian natural audio-visual dataset”
Artikel ilmiah ini membahas tentang LUMINA, sebuah dataset audio-visual multimodal yang dirancang untuk mendukung penelitian dalam bidang persepsi bicara. LUMINA merupakan dataset unik yang menggabungkan data audio dan visual berkualitas tinggi, yang dihasilkan dari rekaman 14 penutur asli bahasa Indonesia, terdiri dari 9 laki-laki dan 5 perempuan. Setiap penutur menyumbangkan sekitar 1.000 kalimat, menghasilkan koleksi data yang sangat kaya dan beragam. Fokus utama dalam rekaman video ini adalah area wajah, khususnya untuk menangkap isyarat visual dan ekspresi yang mendukung proses bicara. Dataset ini memiliki nilai signifikan dalam mendukung penelitian terkait pengenalan dan sintesis bicara, karena menyediakan sumber daya yang berharga untuk memahami bagaimana manusia memproses bahasa lisan. Latar belakang pengembangan LUMINA didorong oleh kebutuhan yang meningkat akan data audio-visual dalam bahasa Indonesia, terutama untuk penelitian terkait lip reading dan sintesis suara. Me...