Att syntetiska röster läser sagor är inget nytt. Redan 2019 skrev jag om familjen i USA som överlät god natt-sagan till röstassistenten Alexa.
Sedan dess har ljudboken fortsatt sin boom och medan lyssnandet på böcker ökar, minskar läsandet. Hjärnforskaren Julia Uddén uppger i DN att det är ingen större skillnad på vad som händer i hjärnan när vi lyssnar på eller läser en bok. Men hur påverkar det oss när uppläsaren är generiskt skapad och inte tillhör en riktig människa av kött och blod?
På ljudboksappen Storytel finns nu fem böcker som har AI-uppläsning. Tjänsten är generös med fyra olika AI-uppläsare per bok, samt en originalinläsning med mänsklig röst. Det är lätt att svajpa sig mellan rösterna. Den som tröttnar på en kan lätt hitta en annan sagoberättare. Boktitlarna är på engelska, ännu finns inte AI-alternativet för svenska böcker.
En av böckerna med AI-uppläsning är den otäcka ljudversionen av ”Hansel and Gretel” (”Hans och Greta”). Danska författarna Benni Bødker och Kenneth Bøgh Andersen har skrivit ljudboken speciellt för Storytel. Texten är trogen Bröderna Grimms original och barnens mamma har en ondskefull roll. Det här är ingen barnbok, utan en skräckis för unga vuxna. Greta drömmer om att svinga yxan mot sin mor och häxans stuga beskrivs som byggd av pepparkakor och pannkakor och mänskligt blod.
Originaluppläsaren Andrew Wincotts röst vibrerar i ett djupt ASMR-läge. Trots lätt läspande s är han en talangfull sagoberättare. Han dramatiserar häxans ”creaking voice” (knarrande röst) utan att slå på övertoner. Berättelsen förs hela tiden framåt, djupare in i skogen.
De fyra AI-uppläsarna når inte samma nivå som sin mänskliga motsvarighet, men de är förvånansvärt trovärdiga. Själv har jag svårt att skilja verklig röst från skapad.
AI-rösten Amanda är till exempel behaglig, som sockrad saft glider hon genom den rysliga folksagan.
Gör ett blindtest på min make och spelar upp olika uppläsningar från slumpmässigt valda Storytel-böcker för honom. Tre med AI-uppläsare och tre med mänskliga. Han lyckas avslöja varenda en. (Pausa här för att ge en applåd.)
Det är i detaljerna som skillnaderna märks. Tonfall, intonationer, pauser, betoningar och temposkiftningar ger den mänskligt upplästa texten mer nyanser och inlevelse.
Jag vill hävda att ljudboksinläsningen är en konstform, ett lyriskt hantverk, likt författarskapet.
Men ljudboken är fortfarande ny och konstformen likaså. Vill vi inte veta mer om hur detta hantverk kan utvecklas?
Mina barn som är riktiga ljudboksslukare. De uppskattar uppläsare som väl matchar bokens genre. När till exempel röstskådespelarproffset Kristin Atherton tolkar ”Howl’s Moving Castle” (”Det levande slottet”) ger det en starkare läsupplevelse.
Men det är en fin balansgång att lyckas som ljudboksinläsare. Av Storytels recensionskommentarer framgår att en del innerligt hatar vissa uppläsare, andra kan inte få nog av sin favoritröst. Med AI-uppläsarna tillkommer vad många i boktjänstens kommentarer kallar ”neutrala röster”. Jag tolkar det som röster som varken irriterar eller väcker engagemang. Som en boksida utan något specifikt typsnitt, kursiveringar eller stora bokstäver. Inga störningar, inget att haka upp sig på.
Andra kommenterar att AI-rösterna är otäcka. Hur mycket AI-uppläsarna än anstränger sig kan de inte bli levande.