Percobaan Transkrip Verbatim Otomatis
Transkripsi Verbatimadalah seni mengubah kata yang diucapkan ke dalam sebuah teks sehingga pesan yang disampaikan sama persis sesuai dengan yang diucapkan.
Sejak 2014 saya penasaran tentang bagaimana kalo proses transkripsi itu menggunakan teknologi. Kita tau sekarang kita bs melakukan “voice command” dari Google App, Siri, atau Cortana di Windows. Beruntungnya, di 2016 ini Google membuka Speech API biar bisa digunakan oleh developer. Nah saya penasaran mencobanya bisa gak buat transkripsi verbatim (daripada bikin machine-learning sendiri dari nol?).
Saya melakukan 3 percobaan.
- Menggunakan file suara transkripsi asli (saya minta file dari mahasiswa jurusan lain)
- Menggunakan file suara kualitas tinggi (WAV, encoding PCM) dengan lingkungan yg saya kondisikan.
- Menggunakan file suara interview dengan ibu saya (?)
Sebelum mencoba API yg sebenarnya lewat google cloud platform, mending pakai versi demonya di link ini (kalian bisa mencobanya). Karena inputnya harus menggunakan microphone, maka saya pakai speaker stereo, audionya saya putar lewat hape.
Hasilnya
- Percobaan 1 fail total. Karena pada awalnya ini file sangat kecil sekali suaranya. Saya naikin amplitudonya dan panjangin temponya (karena mbaknya ngomongnya cepet). Tetap fail. Cuma 5 kata saja yg bisa jadi teks.
- Percobaan 2 sukses. menggunakan 1 kalimat saja tapi (ya jelas sukses)
- Percobaan 3 fail. Hanya kalimat awal dan pertengahan yg bisa dapet.
Kesimpulan sementara saya, per 25 Mei ini Speech API masih belum bisa diandalkan untuk mengubah suara jadi teks bahasa indonesia terutama untuk keperluan transkripsi verbatim. Apalagi orang jawa timur khususnya, kalau ngobrol campur-campur :)) bahasa jawa ,“indo”. Membedakan intonasi, logat dan jg kapan kalimat berhenti sehingga bisa tulis titik atau koma masih menjadi tantangan kedepannya.Penasaran bagaimana perkembangan teknologi di bidang ini 5 tahun mendatang, karena banyak sekali manfaatnya dan bisa menghemat banyak waktu. Tapi jelas saya optimis dalam waktu dekat, ini bisa dilakukan karena perkembangan Artificial Intelligence yg lumayan pesat bbrp tahun ini.