26 May 2021     English   |   Bahasa

Review Project Voice Over for Audiobook dan Text To Speech

  1. Home
  2. Voice Over Blog

Mari kita tilik lebih dalam, perbedaan project voice over dengan durasi yang sama-sama panjang ini. Mari kita lihat lebih jauh lagi apa yang membedakan project ini, apa pro & cons nya, dan apa yang membuat kedua project ini begitu berkesan bagi saya selaku co-founder Inavoice.com.

Jatmiko Kresnatama
Co-Founder Inavoice

Table of Content

Bagi saya dan tentunya Inavoice.com, mengerjakan sebuah project voice over selalu menyenangkan. Mengapa? Karena kami akan bertemu dengan talent voice over baru, client baru, dan tentunya ini menjadi lebih menyenangkan ketika kami mengerti kami akan berbagi rejeki dengan orang lain.
 
Bagi Inavoice.com bekerja bersama dengan lebih banyak orang dan membantu banyak orang to achieve their dream merupakan salah satu tujuan ketika saya dan teman-teman mendirikan digital voice over agency ini. Kami sangat beruntung karena kami mampu mendapatkan kesempatan itu.
 
2 project yang sangat membekas dalam ingatan saya adalah project voice over bersama salah satu start up Neuro-Linguistic Programming yang sedang sangat berkembang di Indonesia, dan juga salah satu perusahaan penerbitan buku terbesar di Indonesia.
 
2 perusahaan ini mempercayakan kami untuk mengerjakan project voice over dengan lisensi yang sama, yaitu long duration voice over license, namun dengan tipe project yang berbeda yaitu text to speech dan audiobook. Yuk kita tengok apa sih yang saling membedakan 2 project ini, dan apa saja tantangan dalam mengerjakannya.
 
 

Review Project Voice Over Audiobook

Mengerjakan project audiobook merupakan sebuah hal yang menyenangkan, khususnya bagi Inavoice karena project audiobook memiliki tantangan tersendiri. Mulai dari durasinya yang cukup panjang, stamina talent yang harus sangat diperhatikan, hingga proses “mengakali” mixing yang menurut saya cukup berhasil.
 
Biasanya mengerjakan sebuah project audiobook memiliki rentang waktu yang cukup panjang, dan setiap agency atau post production studio memiliki ketentuannya sendiri dalam menentukan lama produksinya.
 
Inavoice sendiri biasanya memberikan ketentuan untuk sebuah project voice over berdurasi panjang akan kami kerjakan dalam waktu 1-14 hari, yang mana ini merupakan waktu paling efisien bagi talent, client, dan kami selaku pemroduksi produk.
 
Namun ada sedikit cerita berbeda, kami mendapatkan sebuah project dengan timeline 4 hari pengerjaan sudah termasuk editing, mixing, dan mastering. Sungguh menjadi prestasi bagi kami sendiri karena kami dapat mengerjakan project tersebut sesuai waktu yang ditentukan dan pula tanpa revisi.
 
Mengerjakan project audiobook seperti yang sudah dijelaskan di atas memang cukup menantang karena tenggat waktu yang cukup pendek dengan durasi naskah yang cukup panjang. Namun yang sedikit melegakan adalah Intonasi voice over yang digunakan untuk project ini tidak banyak variasi, sehingga talent memiliki stamina yang lebih untuk melafalkan naskah voice over yang telah dikirimkan client.
 
Ada beberapa jenis project audio book memang, dan kebetulan kami mendapatkan audio book untuk bahan bantu belajar siswa SD hingga Kuliah. Intonasi yang digunakan tidak terlalu variatif, sehingga dari sini, kami dapat mengukur bahwa project ini masih memungkinkan untuk dikerjakan.
 
Sebenarnya saya sudah menulis dengan lengkap mengenai pengalaman Inavoice.com dalam mengerjakan project Audiobook dalam blog kami yang berjudul Cara Inavoice Bekerja Bersama Penerbit Buku Terbesar di Indonesia.
 

Review Project Voice Over Text to Speech

NLP atau neuro-linguistic programming memang sedang menjadi primadona beberapa waktu ini. Mulai dari perkembangan Artificial Intelligence dan bahkan penggunakan NLP dalam dunia SEO yang terus berkembang.
 
NLP sendiri memiliki beberapa jenis ruang lingkup, salah satunya adalah text to speech, dimana hasil rekaman voice over akan melewati proses concatenation yang mana menyatukan berbagai suku kata melalui bantuan programming dan ai menjadi sebuah rangkaian kalimat yang enak didengar.
 
NLP merupakan sebuah hal yang kompleks, sehingga untuk mengerjakan sebuah project voice over untuk text to speech, biasanya voice over talent atau bahkan voice over agency akan mendapat script dengan durasi yang cukup panjang.
 
Jangan bayangkan alur naskah voice over yang bercerita, bayangkanlah naskah terbagi menjadi beberapa prompt yang mungkin satu dengan yang lain tidak berkaitan sama sekali. Hal ini ditujukan untuk mendapatkan banyak variasi hasil pembacaan kata yang lebih banyak, dan memiliki banyak variasi nada untuk setiap suku katanya.
 
 
Talent voice over akan merekam suara berdasarkan naskah yang telah dibuat, dengan berbagai intonasi yang telah diminta oleh client. Kadang client meminta berbagai macam intonasi dari naskah yang ia kirimkan. Inilah yang membuat project perekaman text to speech voice over menjadi lebih menantang dibandingkan long duration project lainnya.
 
Teman-teman perlu memperhatikan stamina, dan tentunya intonasi sesuai request dari client. Tanpa dibantu voice director, voice over talent mungkin akan sedikit kesulitan untuk mengerjakan project ini sendirian.
 
Ada beberapa pertanyaan yang sering ditanyakan oleh banyak pihak, termasuk client dan voice over talent. Apa itu? Yuk kita simak penjabarannya di bawah ini :

1. Apakah Text To Speech Termasuk Product Voice Over?

Menurut saya secara personal, text to speech bukan merupakan produk voice over, ini adalah produk olahan hasil produksi voice over yang kemudian secara pintar diolah oleh artificial intelligent (AI) untuk mampu melakukan berbagai pekerjaan khusus, seperti chatbot, smart assistant seperti alexa, siri, cortana, dan banyak hal lainnya.
 
Lantas apa yang membedakan text to speech sehingga ia bukan merupakan produk voice over? Memang betul bahwa untuk membuat produk text to speech yang baik, pemroduksi harus memiliki asset suara voice over yang sangat banyak untuk melatih AI agar bisa menjawab pertanyaan-pertanyaan. Namun ini bukanlah voice over, voice over hakikatnya adalah suara manusia yang direkam untuk menyampaikan pesan, dan didistribusikan sesuai dengan pola-pola distribusi baik ads ataupun broadcasting.
 
Voice over memang mengalami proses lebih lanjut, yaitu proses mixing dan mastering, begitu pula produk text to speech yang juga melewati proses ini. Namun voice over tidak melewati concatination, yang mana bagian-bagian yang sudah di rekam akan dipecah, dan disatukan dengan bantuan pemrograman dari AI.
 
Ini yang membedakan text to speech dengan voice over. Benar adanya bahwa untuk memproduksi sebuah text to speech dibutuhkan sebuah perekaman suara yang memiliki treatment ‘mirip’ voice over, namun apakah ini bisa disebut voice over? Saya rasa tidak.

2. Apakah Text To Speech Mampu menggantikan Voice Over?

Lagi-lagi, menurut saya, hal ini mungkin terjadi. Mengapa begitu? Karena hal ini akan sangat tergantung dari perkembangan teknologi Artificial Intelligence itu sendiri.
 
Sampai saat ini, voice over masih unggul dalam menyampaikan pesan sebuah brand atau perusahaan karena dibacakan langsung oleh manusia dan terasa memiliki estetika yang lebih bila dihubungkan dengan intonasi, pelafalan, tempo, dan yang lainnya bila dibandingkan dengan hasil text to speech.
 
Namun kita juga perlu menyadari bahwa teknologi AI terus berkembang. Masih ingatkan bagaimana suara smart assistant google pada saat awal dikembangkan? Terasa sangat payah, patah-patah, dan tidak seperti suara manusia. Kondisi saat ini sudah jauh lebih baik dan lebih enak didengar. Sudah terdengar seperti manusia yang berbicara, namun dengan intonasi yang masih sedikit kaku.
 
Inilah yang membuat saya meyakini bahwa suatu saat teknologi text to speech mampu mengerjakan sebuah produk voice over. Suatu saat, dalam waktu yang masih sangat panjang ke depan menurut saya.
 
Saat ini, belum ada yang dapat mengalahkan kemampuan improvisasi intonasi dari cara membaca manusia, bahkan sepintar apapun Artificial Intelligence tersebut.

Kesimpulan

Mengerjakan project dengan durasi yang panjang pasti memiliki tantangan tersendiri, begitu pula dengan dua jenis perekaman voice over ini. Text to speech memiliki kompleksitas yang cukup tinggi, dimana biasanya voice over talent dituntut untuk merekam suara banyak prompt dengan berbagai macam intonasi untuk memenuhi asset audio untuk melatih AI.
 
Sedangkan audiobook tak kalah banyak. Biasanya dihitung jumlah naskahnya dan chapter yang akan dibacakan. Intonasi yang harus digunakan juga telah ditentukan untuk client, namun biasanya cenderung lebih flat, dan menyesuaikan tuntutan cerita dari audiobook yang dibacakan.
 
Dua project ini memiliki karakteristiknya masing-masing, dan harus dibacakan dengan baik agar tujuan penggunaannya audionya tepat guna.
 
Lantas, Inavoice pilih project yang mana? Kami tak akan memilih project yang masuk, karena kami sangat suka mengerjakan perekaman suara. Kami suka bekerja bersama banyak orang, dan tentunya berguna bagi orang lain.
 
Terima kasih telah membaca artikel ini, dan sampai jumpa pada artikel yang saya tulis selanjutnya.

 


Klik icon di atas untuk mengunduh artikel dalam bentuk pdf.