Da li su ovi superimpresivni AI glasovi audio knjiga dobri ili loši?

Sadržaj:

Da li su ovi superimpresivni AI glasovi audio knjiga dobri ili loši?
Da li su ovi superimpresivni AI glasovi audio knjiga dobri ili loši?
Anonim

Key Takeaways

  • DeepZen koristi AI (umjetnu inteligenciju) za stvaranje zapanjujuće realističnih audioknjiga od teksta.
  • Tehnika koristi prave ljudske glasovne glumce kako bi osigurala gradivne blokove.
  • Amazon i Audible trenutno ne prihvataju kompjuterski generisane audio knjige.
Image
Image

DeepZen je kompanija koja stvara kompjuterske glasove koji se koriste u audio knjigama, na osnovu stvarnih glasova ljudskih glumaca. Kvalitet je zastrašujući - dovoljno dobar za slušanje satima. Trik je ovdje komponenta AI (vještačka inteligencija), koja može pročitati tekst i zaključiti ispravan emocionalni odgovor na osnovu konteksta. Zatim stavlja tu emociju u glas.

Impresivan je i vrlo zgodan. Ali želimo li zaista homogeno iskustvo audio knjiga? A šta je sa tim glasovnim glumcima?

"Iz perspektive indie izdavača, sve što smanjuje troškove proizvodnje audio knjiga je vrlo zanimljivo, " rekao je za Lifewire putem e-pošte Rick Carlile, vlasnik nezavisnog izdavača Carlile Media.

"Ali ta privlačnost pretpostavlja da bi proizvod bio jednakog kvaliteta kao i tradicionalna naracija. Ne mislim da smo tu još sto posto. Nemojte me pogrešno shvatiti, DeepZen je zapanjujuće dobar. ogroman napredak, a njegovi kreatori zaslužuju ogromne pohvale i uspjeh. Ali još uvijek nije savršen."

Audio To je 'dovoljno dobro'

Najbolji način da se shvati kvalitet DeepZen-a je da slušate uzorke. Da niste znali da su kompjuterski generisani, možda ne biste ni shvatili. Ionako ne neko vrijeme. Pretpostavimo da je DeepZen-ova AI savršena i da nikada pogrešno ne tumači emocionalne note koje bi trebao pogoditi.

Image
Image

Čak i tada, čovjek može ponuditi nijansiranija i često više iznenađujućih tumačenja. Glumac bi mogao neočekivano izokrenuti riječi koje kompjuter nikada ne bi ni razmotrio. A u stvarnosti, AI interpretacija sigurno još nije tako dobra kao kod profesionalnog glasovnog glumca.

"Kao onaj koji radi na filmovima i nedavno u svijetu audio naracije, dok sam impresioniran umjetnom inteligencijom - pouzdano znam da postoje duboke dubine značenja koje mašina ne može protumačiti", profesionalni glas glumac Paul Cram rekao je za Lifewire putem e-pošte.

"Hoće li ga koristiti nepoznati autori? Garantujem da hoće jer je 'dovoljno dobar'"

Biti dovoljno dobar, u kombinaciji sa praktičnošću i uštedom troškova, može biti dovoljno da indie izdavače navede na uslugu.

"Audio knjige mogu koštati do 500 USD po završenom satu zvuka (mnogo više za glas slavnih), a to ne uključuje troškove vremena upravljanja i administratora", kaže Carlile. "Mogućnost prepoloviti taj trošak jednostavnim postavljanjem rukopisa na provajdera kao što je DeepZen je izuzetno atraktivna."

Talking Trouble

Još nije tako lako kao otpuštanje glasovnih glumaca i postavljanje rukopisa na DeepZen. Trenutno postoji jedna prepreka lakom govoru AI-a audio knjiga, a dolazi od Amazona.

Image
Image

"Trenutno, ACX, put samoizdavača ka Audible i Amazon distribuciji audioknjiga, neće prihvatiti audioknjige koje čovjek nije snimio", kaže Carlile.

Zašto? Kvaliteta. Evo unosa FAQ sa web stranice:

"Pretvaranje teksta u govor ili drugi automatizovani snimci nisu dozvoljeni. Čujni slušaoci biraju audio knjige za izvođenje materijala, kao i za priču. Da biste ispunili to očekivanje, vašu audio knjigu mora snimiti čovek."

To znači da su audio-knjige generirane DeepZen-om barem za sada van ponude. Ovo je čista spekulacija, ali DeepZen bi izgledao kao prilično dobra akvizicija za Amazon, dopuštajući mu da proda uslugu i da je zadrži isključivo za Audible knjige. Čak i ako se to ne dogodi, ako je kvalitet kompjuterski generiranih audio knjiga ovako dobar, onda se čini malo razloga da se ne napravi izuzetak od ovog pravila.

Da li biste rado slušali audio knjige napravljene na ovaj način? Kada se to dogodi, većina ljudi neće ni sumnjati. Neki bi možda više voleli savršenstvo kompjuterski generisanih glasova jer će biti oslobođeni vokalnih tikova i navika koje ponekad mogu odvući pažnju. Tehnologija je također pogodna za video igrice, TV i radio reklame i bilo koji drugi scenarij u kojem biste unajmili glasovnog glumca.

DeepZen-ova tehnologija bi također bila odličan način za automatsko kreiranje podcasta vijesti od pisanih članaka, što bi moglo biti zgodno za putovanje na posao.

A šta je sa onim glasovnim glumcima? Pa, postojat će barem jedna prilika: mogu otići i raditi za DeepZen.

Preporučuje se: