Hoppa till innehållAftonbladet

Dagens namn: Valfrid, Manfred

Gamla dialekter guld värda för AI

Publicerad 12.52

Dialektinspelning i Jämtland 1948. Då trodde ingen att inspelningarna skulle bli viktiga för framtidens teknik.

Hur kan några halländska gubbar göra AI-tekniken bättre?

När amerikanska tal till text-modeller ska lära sig svenska har gamla dialektinspelningar visat sig vara en guldgruva.

På Institutet för språk och folkminnen (Isof) har man jobbat mycket med dialektuppsamling, framför allt åren 1935 till 1970 åkte forskare runt i landet och spelade in hur folk pratade.

– Syftet från början var i mångt och mycket att bevara de traditionella dialekterna, berättar Annette C Torensjö, chef för Avdelningen för arkiv och forskning i Uppsala vid Isof.

Inspelningarna användes i många år huvudsakligen av forskare, men förra året tog KB-Labb vid Kungliga biblioteket kontakt. Leonora Vesterbacka är senior data scientist och leder ett projekt med att träna tal till text-modeller, som ”översätter” tal till skriven text.

Liten del svenska

Amerikanska AI-modeller är ofta tränade på så kallad massiv flerspråkighet och då blir den svenska delen väldigt liten.

– Det finns en modell från Open AI som heter Whisper och den är tränad på 680 000 timmar på massa olika språk, varav runt 2 000 timmar svenska. Det är 0,3 procent svenska, berättar Leonora Vesterbacka.

Modellerna fungerar bra på rikssvenska, men sämre på dialekter. Det är här de halländska gubbarna, och andra som fått sina dialekter inspelade, kommer in.

– Hade någon sagt till mig på 1980-talet att det nya guldet kommer att vara en gammal konstig rulle med inspelningar i ett arkiv hade jag trott att de skämtade.

Man använder sig också av protokoll och inspelningar från Riksdagsförvaltningen.

– De ansvarar ju för att spela in det som sägs i riksdagen och sedan tillgängliggöra det och släppa protokoll. Det har skett jättelänge.

– I Sverige är vi så duktiga på att bevara allting. Det är häftigt att se att det går att använda i framtiden också.

Göra tillgängligt

När modellerna är färdigtränade kan de till exempel användas för att transkribera läkarjournaler och möten eller skriva undertext till tv-sändningar. De kan också användas för att göra talat material, som poddar och tv-sändningar från myndigheter, tillgängligt.

På Isof hade man inte trott att deras gamla dialektinspelningar skulle bli ett viktigt steg in i framtiden.

– Jag är väldigt nöjd med att våra dialektinspelningar verkligen har så stor relevans nu, att det här är någonting som man faktiskt kan jobba med som en del av samhällsutvecklingen, säger Annette C Torensjö.