Dari Prosa ke Gemini Voice: Kisah Naik Turun TTS Bahasa Indonesia (2024–2026)

Dari Prosa ke Gemini Voice: Kisah Naik Turun TTS Bahasa Indonesia (2024–2026)

Malam Ketika Saya Sadar Sebuah Era Sudah Berakhir

Kemarin malam saya iseng melakukan sesuatu yang sudah lama tidak saya lakukan.

Saya mencoba login lagi ke akun Prosa TTS.

Entah kenapa tiba-tiba teringat saja. Mungkin karena beberapa hari terakhir komunitas TTS sedang ramai membicarakan perubahan kebijakan Google soal Gemini.

Saya pikir Prosa masih ada. Paling tidak masih hidup dalam mode terbatas, atau sekadar tersisa sebagai layanan lama yang jarang dipakai. Dan sedikit berharap juga, dengan makin bagusnya berbagai Text to Speech lokal yang banyak ngiklan di Facebook, siapa tahu Prosa udah berkembang.

Namun begitu membuka halaman mereka, saya langsung sadar sesuatu.

Prosa ternyata sudah berhenti beroperasi sejak Desember 2025.

Tidak ada lagi layanan TTS yang dulu cukup sering dipakai oleh banyak creator Indonesia.

Rasanya agak aneh.

Bukan karena saya masih menggunakannya—sejujurnya saya sudah lama pindah ke tool lain.

Tapi melihatnya benar-benar hilang membuat saya sadar satu hal:

Teknologi yang digunakan Prosa sepertinya makin tertinggal jauh oleh teknologi Google AI.


Perjalanan Saya Mencari TTS Bahasa Indonesia

Kalau kamu sering membuat konten video, podcast, atau narasi digital, kamu pasti tahu satu masalah klasik:

mencari Text-to-Speech bahasa Indonesia yang natural itu tidak mudah.

Yang gratis sering terdengar robotik.
Yang suaranya bagus biasanya mahal.

Perjalanan saya mencoba berbagai TTS sebenarnya cukup panjang. Saya sempat melewati beberapa generasi teknologi yang berbeda.

Urutannya kira-kira seperti ini:

Speechelo →
Prosa →
Clipchamp / CapCut →
Google AI Studio →
TTS lokal berbasis Gemini.

Setiap fase membawa peningkatan kualitas.

Dan setiap fase juga menunjukkan bagaimana cepatnya teknologi voice AI berkembang.


Fase Awal: Eksperimen dengan Speechelo

Salah satu TTS pertama yang saya coba adalah Speechelo, sebuah software yang dulu cukup populer untuk membuat voiceover.

Saya bahkan sempat membelinya lewat marketplace karena banyak yang merekomendasikannya untuk konten YouTube.

Untuk bahasa Inggris, Speechelo sebenarnya cukup bagus.

Baca Juga  Benarkah Bahasa Arab Adalah Bahasa Khusus Umat Islam Sekaligus Bahasa Syurga?

Intonasinya masih terasa natural dan bisa dipakai untuk voiceover video.

Namun ketika dipakai untuk bahasa Indonesia, hasilnya jauh dari memuaskan.

Aksennya aneh.
Pengucapan kata sering salah.
Intonasinya terasa kaku.

Jujur saja, hasilnya cukup menyedihkan.

Dari situ saya mulai mencari alternatif yang memang lebih cocok untuk bahasa Indonesia.


Era TTS Lokal: Saat Prosa Masih Jadi Andalan

Setelah itu saya menemukan Prosa TTS, salah satu layanan voice AI lokal yang cukup dikenal di Indonesia.

Banyak creator waktu itu menggunakannya untuk membuat voiceover konten.

Dibandingkan Speechelo, Prosa jelas lebih cocok untuk bahasa Indonesia.

Pengucapan katanya lebih akurat dan terasa lebih natural.

Namun seiring waktu, saya mulai jarang memakainya.

Bukan karena Prosa buruk, tetapi karena mulai muncul alternatif yang lebih praktis.


Beralih ke Clipchamp dan CapCut

Saat mulai lebih sering membuat konten video, saya akhirnya lebih banyak menggunakan Clipchamp.

Clipchamp adalah editor video berbasis web milik Microsoft yang sudah memiliki fitur Text-to-Speech bahasa Indonesia di dalamnya.

Keunggulan utamanya adalah workflow yang praktis.

Prosesnya sederhana:

tulis teks → generate suara → langsung masuk timeline video.

Kadang saya juga memanfaatkan CapCut, terutama untuk editing cepat di mobile.

Kedua tool ini gratis dan cukup membantu untuk kebutuhan voiceover sederhana.

Namun tetap saja ada sesuatu yang terasa kurang.

Kualitas suaranya lumayan, tapi belum benar-benar terasa natural untuk narasi panjang.


Titik Balik Besar: Google AI Studio

Sekitar awal 2025, mulai banyak orang membicarakan Google AI Studio dengan model Gemini.

Banyak tutorial bermunculan di YouTube yang menunjukkan bagaimana menggunakan platform ini untuk membuat voice AI.

Karena penasaran, saya mencoba sendiri.

Dan di sinilah saya merasakan lompatan teknologi yang besar.

Suara bahasa Indonesianya terasa jauh lebih hidup dibanding TTS yang pernah saya gunakan sebelumnya.

Intonasinya lebih natural.
Jeda kalimat terasa manusiawi.
Narasinya cocok untuk storytelling.

Sejak saat itu saya tidak pernah kembali lagi ke Clipchamp ataupun Prosa untuk urusan TTS.

Baca Juga  Kebangkitan DeepSeek AI: Ancaman atau Peluang Untuk Masa Depan?

Google AI Studio menjadi tool utama saya untuk membuat voiceover.


Munculnya TTS Lokal Berbasis Gemini

Sekitar setahun terakhir, mulai bermunculan layanan TTS lokal berbasis teknologi Gemini.

Beberapa yang cukup sering terlihat antara lain:

  • Sulap Suara
  • Magic Voice
  • Nara Swara
  • Voxliblab
  • Perfect Voice

Layanan ini menarik karena memanfaatkan teknologi AI terbaru untuk menghasilkan suara yang jauh lebih ekspresif.

Awalnya saya hanya melihatnya lewat berbagai iklan, terutama di Meta Ads.

Namun setelah cukup sering melihat iklannya, akhirnya di awal 2026 saya memutuskan untuk mencoba membeli salah satunya. Karena mereka manawarkan berbagai dialek bahasa daerah dan Kids voice yang tidak saya temukan secara langsung di Google AI Studio.

Kualitasnya memang menarik.

Rasanya seperti melihat generasi baru TTS bahasa Indonesia yang jauh lebih natural dibanding generasi sebelumnya.


Drama Kebijakan Google yang Membuat Komunitas Heboh

Namun belum lama saya menggunakan layanan tersebut, tiba-tiba muncul kehebohan di komunitas user dan developer.

Topik yang muncul hampir sama di berbagai forum:

kuota Gemini mulai dibatasi.

Beberapa pengguna mulai mengeluh bahwa request mereka gagal.

Ada juga yang mendapati limit gratis habis jauh lebih cepat dari biasanya.

Developer yang menjalankan layanan TTS mulai menyadari sesuatu.

Google mulai mengubah kebijakan penggunaan Gemini.

Untuk penggunaan stabil dan skala besar, layanan kini perlu menggunakan API key berbayar.

Bagi developer TTS lokal, perubahan ini tentu bukan kabar kecil.

Sebagian layanan mulai:

  • membatasi jumlah penggunaan
  • mengubah model bisnis
  • atau menyiapkan sistem berlangganan

Bagi banyak creator, momen ini terasa seperti akhir dari masa indah TTS berbasis Gemini yang murah dan berkualitas tinggi.


Dugaan Kenapa Prosa Akhirnya Tutup

Sebagai pengguna lama, saya tentu tidak tahu alasan internal Prosa.

Namun dari sudut pandang pengguna, ada beberapa kemungkinan yang terlihat cukup jelas.

Pertama, banyak creator mulai beralih ke alternatif gratis seperti Clipchamp dan CapCut.

Baca Juga  Gosip Cara Tukang Ojek Berpenghasilan di Atas UMR

Kedua, kualitas voice AI berkembang sangat cepat. Ketika Google AI Studio muncul, kualitasnya terasa jauh lebih natural dibanding generasi sebelumnya.

Ketiga, munculnya TTS lokal berbasis Gemini membuat persaingan semakin berat.

Jika pengguna individu semakin berkurang, wajar jika sebuah layanan akhirnya kehilangan banyak pelanggan dan sulit bersaing.


Perbandingan TTS yang Pernah Saya Pakai

Berikut pengalaman singkat saya menggunakan beberapa TTS yang pernah saya coba.

TTSKualitas Bahasa IndonesiaKelebihanKekurangan
SpeecheloKurang bagusBahasa Inggris cukup naturalAksen Indonesia aneh
Prosa TTSLumayanDibuat khusus untuk bahasa IndonesiaIntonasi kurang ekspresif
Clipchamp / CapCutCukupGratis dan praktis untuk editing videoKurang natural untuk narasi panjang
Google AI StudioSangat bagusIntonasi natural dan ekspresifKuota gratis terbatas

Timeline Perkembangan TTS Indonesia (2024–2026)

2024
Banyak creator masih menggunakan software TTS lama seperti Speechelo.

Awal 2025
Google AI Studio mulai populer setelah banyak tutorial muncul di YouTube.

2025
Creator mulai memanfaatkan Clipchamp dan CapCut untuk voiceover cepat.

Desember 2025
Prosa TTS resmi berhenti beroperasi.

Awal 2026
TTS lokal berbasis Gemini mulai diiklankan secara luas.

Maret 2026
Google memperketat kebijakan penggunaan Gemini dan mendorong penggunaan API berbayar.


Prediksi Masa Depan TTS Indonesia (2026–2027)

Melihat perkembangan ini, kemungkinan besar ekosistem TTS Indonesia akan berubah lagi.

Beberapa kemungkinan yang bisa terjadi:

1. TTS lokal akan beralih ke model berlangganan
Karena biaya API Gemini tidak murah.

2. Developer mungkin mencoba membangun model AI sendiri
Agar tidak terlalu bergantung pada API perusahaan besar.

3. TTS akan semakin terintegrasi dengan tools creator
Seperti CapCut, Canva, atau platform editing video lainnya.

4. Kualitas voice AI akan semakin realistis
Perbedaan antara suara AI dan manusia kemungkinan akan semakin sulit dibedakan.


Perjalanan yang Masih Berlanjut

Jika melihat perjalanan beberapa tahun terakhir, perkembangan TTS terasa sangat cepat.

Dari suara robotik seperti Speechelo…
ke Prosa yang lebih lokal…
ke Clipchamp yang praktis…
hingga akhirnya ke Gemini yang terasa sangat natural.

Sekarang mungkin kita sedang berada di fase transisi baru.

Namun satu hal yang hampir pasti:

perjalanan teknologi voice AI bahasa Indonesia masih jauh dari selesai.

Dan mungkin saja, beberapa tahun ke depan kita akan melihat perubahan besar berikutnya.

0 0 votes
Article Rating
Subscribe
Notify of
guest
0 Comments
Inline Feedbacks
View all comments
Copyright © 2026 Belajar... Tumbuh... Berbagi
0
Would love your thoughts, please comment.x
()
x