– Att sammanställa alla människans språk är mer brådskande än det var att kartlägga vår arvsmassa. När den siste talaren av ett språk dör dör också språket för gott. Varannan vecka går något språk förlorat, säger den australiske språkforskaren Steven Bird.
I samband med den internationella konferensen i datorlingvistik i Uppsala i veckan presenterade han det nya projektet – och uppmanade deltagarna att själva bidra till det.
– Meningen är att vem som helst som följer vissa regler ska kunna bidra och att uppgifterna ska vara fritt tillgängliga, både för språkforskare och för allmänheten i stort, säger Steven Bird.
Själv ska han bidra till denna gigantiska språkportal med exempel på många av de små, utrotningshotade språken på Papua Nya Guinea.
– Eftersom de saknar skriftspråk är enda sättet att få uppgifter om dessa språk är att göra ljudupptagningar med de människor som fortfarande talar dem, säger Steven Bird.
På Papua Nya Guinea arbetar ett stort antal studenter med detta. Ett hundratal elektroniska minidiktafoner, var och en med en kapacitet att lagra 50 timmars tal, delas ut till de (oftast äldre) personer ute i byarna som fortfarande kan tala något av de olika stamspråken.
– De är ofta fantastiska historieberättare. Oftast börjar de med att berätta sin egen historia, sedan stammens historia och till sist om sina sånger, medicinalväxter och annat. Sedan skriver studenterna ner och översätter ett urval av detta, säger Steven Bird.
Informationen, både muntlig och skriftlig, lagras i projektets databas. Med exempel från två talare av varje språk räcker de 100 diktafonerna till att kartlägga 50 av Papua Nya Guineas mer än 800 språk.
– Ett problem är att skriva ner vad de säger. Eftersom det saknas skriftspråk finns inga regler för hur orden stavas, säger Steven Bird.
Samtidigt som det nya projektet är en slags sista chans att bevara mycket av den språkliga mångfalden framhåller han att det är mycket mer än en sorts Noaks Ark för att rädda utrotningshotade språk.
– Ju mer information om språklig mångfald som finns tillgänglig, desto större är chanserna att ta reda på vad som är gemensamt för människans alla språk.
Om det är viktigt? Ja, språket brukar betecknas som det främsta kännetecknet för människans intelligens, säger Steven Bird.
För engelska, kinesiska, spanska, japanska, franska och flera andra stora språk finns redan en enorm mängd sökbara uppgifter på Internet. Men att många talar ett språk innebär inte automatiskt att det finns mycket information om det.
– Trots att hindi talas av hundratals miljoner människor skulle vi behöva många fler exempel på hur det språket används i tal och skrift, säger Steven Bird.
Från det att HUGO-projektet för att kartlägga människans arvsmassa drog igång dröjde det drygt tio år innan ett första utkast till en komplett kartläggning av hennes dna-spiral var klar. Det nya HLP-projektet – human language project – lär ta längre tid att fullborda.
– Var vi står om fem år? I dag har vi representativa data för bara omkring en halv procent av världens alla språk, om fem år tror jag att de finns för tio gånger fler språk. Och jag tror att vi då har automatiserade översättningsprogram för omkring 100 språk, dubbelt så många som i dag, säger Steven Bird.
Världens språk ska kartläggas
Nu startar språkforskarnas motsvarighet till kartläggningen av människans hela arvsmassa. Målet är att i digital form skapa en komplett sammanställning över världens alla språk. Flera av dem är akut utrotningshotade.
Med sina berättelser i elektroniska minidiktafoner ser de här båda männen till att usarufa-språket på Papua Nya Guinea inte kommer att utplånas, även om inga människor längre skulle tala det.
Foto: Steven Bird
... att det i världen i dag finns cirka 6 900 olika språk?
... att fler än hälften av världens språk saknar skriftspråk?
... att det i Australien finns 90 språk som vardera kan talas av färre än fem personer?
... att 95 procent av världens språk talas av sammanlagt bara fem procent av jordens invånare?
... att fler än hälften av jordens språk vardera talas av färre än 10 000 personer?
... att hälften av jordens invånare talar något av de tio största språken, mandarin, engelska, hindi, spanska, arabiska, portugisiska, bengaliska, ryska, japanska och tyska?
... att mandarin-kinesiska är det språk som till vardags talas av flest människor, nära 900 miljoner? Näst största vardagsspråket, engelskan, talas av knappt 500 miljoner.