Svenska dialektmaskiner

Fredrik Lindström är min husgud. Och nu är det dags igen. På onsdag åker han till Värmland i det första av åtta nya avsnitt i serien om svenska dialektmysterier. Och jag sitter bänkad. Bloggredaktionen värmer upp med par dialektmaskiner.

Visst är det vackert med dialekter? Och på modet! En dialekt säger mer än tusen ord – en garant för att du är att lita på. Som hälsing levde jag länge i tron om att jag talar rikssvenska. Förmodligen växer många svenskar upp i sådana villfarelser. När jag träffar Stina (som också bloggar här) hör jag att det inte är rikssvenska. Men det är vackert. Och det är att lita på. Tack för det!

Om Bertil Lyberg talar rikssvenska vet jag inte, men han satt i alla fall på Telia i Farsta på 90-talet och försökte förstå språkets olika dialekter på artificiell väg. Bertil lämnar i skrifterna SE 504 177 och SE 506 003 förslag på två svenska dialektmaskiner. Uppfinningarna hittar du i Svensk Patentdatabas.

Den första, en taligenkänningsutrustning för dialektala variationer, fungerar som följer: Anna, med vacker Helsingborgsdialekt, talar i dialektmaskinen. Maskinen gör dels en procedur för taligenkänning, dels tar den fram Annas grundtonskurva. Ur taligenkänningen skapas en allofonsträng.

Allofonsträngen innehåller språkspecifika uttryck, kanske i Annas fall varianter på r-ljud. (Uppsvensken skulle eventuellt, och något nedsättande, kalla detta för avvikelser – det gör inte jag.)  Allofonsträngen och grundtonskurvan utnyttjas för att hitta grundtonens max- och minvärden.

Dialektmaskinen jämför nu det igenkända talet mot ett språklexikon med ortografi och transkription (den ambitiöse läsaren hittar definitioner nedan) för att finna lämpliga ordkandidater. De funna ordkandidaterna analyseras vidare syntaktiskt. Dessa syntaktiska och lexikala informationer utnyttjas för att bilda en modell av talet. Modellens grundtonsstruktur och talets grundton jämförs, grundtonernas max- och minvärden fastställs, och därmed finns en skillnad mellan modellen och Annas tal. Den skillnaden påverkar modellen så att talen kommer att överensstämma. Ungefär så här kan alltså maskinen träna upp sig till att känna igen Annas Helsingborgsdialekt.

Den andra uppfinningen är en tal-till-tal-omvandlare. Ett användningsområde för den skulle kunna vara i ett röststyrt telefonsystem. Dels kan det vara svårt för ett automatiskt telefonsystem att ta ut det verkligt informativa i en gravt dialektalt framställd förfrågan – dels skulle man, som ren kundservice, kunna tänka sig att telefonsystemet svarar på samma dialekt som kunden (”tala med bönder på bönders vis …” osv.).

Tekniskt handlar den andra uppfinningen om att plocka ut prosodiinformation, alltså information om talets intonation, rytm och dynamik, och jämföra den med grundtonskurvan, ungefär som ovan.

Om den senare maskinen är i bruk eller inte vet jag inte, men vilka möjligheter den öppnar för! Glenn Hysén ringer till CSN för att förhöra sig om han är berättigad till studiemedel. En maskin svarar, lite avmätt på bred göteborgska: ”E’ du goo’ eller..?”. Eller Anna i Helsingborg (från första exemplet) som blir placerad i Försäkringskassans telefonkö och på grundval av sina skånska allofoner får höra pausmusik av Danne Stråhed. (Förmodligen lägger hon på…)

Eller du själv, när du sitter där ensam och uttråkad på det ospecificerade hotellet på den regniga turistorten, det svenska kaffet är slut sedan länge och hemlängtan håller på att bryta ner dig i bitar. Tänk då att få fatta luren, ringa till en automatisk telefonsvarare hemmavid och få tala med någon som tar sig tid att tala just till dig, och som talar precis lika vackert som du.

Missa inte Lindström på onsdag!

Stefan Hultquist, enhetschef PRV

Fotnot:

Fonem är betydelseskiljande foner, språkljud, som formar språket. Olika ord är uppbyggda av olika fonem. Ett fonem brukar därför anges som det talade språkets minsta betydelseskiljande enhet. Man tar reda på om ett ljud är ett fonem eller bara en fon genom att bilda minimala ordpar (t.ex. ”bil” och ”fil”).

Fonem och allofoner: Kort ä är ett fonem, trots att dess uttal varierar mellan ord som ”värk”, ”välj” och ”väck”. Dessa kontextuella uttalsvarianter kallas för allofoner, som alltså är varianter på fonem. De olika r-ljud som används i södra Sverige är också allofoner av samma fonem – r. Allofoner är alltså språkspecifika uttalsvarianter på fonem, som gör att ord kan uttalas på olika sätt men ändå ha samma betydelse; de uttalas olika men får inte en betydelseskiljande effekt. Olika språk har olika betydelseskiljande språkljud och därigenom även olika allofoner.

Ortografi handlar om stavning, interpunktion, bruket av versaler och gemener, avstavning och särskrivning. Ortografi kan oftast direkt översättas med skriftspråk och inte sällan med stavning. Man kan också med ordet avse relationen, ”samspelsmönstret”, mellan ett språks grafem (skrivtecken) och dess fonem (”språkljudsenheter”), tryckaccenter och tonaccenter med mera. I finskans ortografi dubbeltecknas till exempel lång vokal, medan så inte är fallet i svenskans ortografi.

Transkription betyder här att nedteckna talat språk så att uttalet framgår. Vid transkription strävar man efter att uttalet ska återges så att det motsvarar källan. När uttalet ska återges så exakt som möjligt kan man transkribera till det internationella fonetiska alfabetet.

Syntax eller satslära betyder inom språkvetenskapen beskrivningar i form av regler för hur man i ett givet språk sätter samman enskilda enheter till, satser och meningar. För att underlätta analyserandet av syntaxen i språk brukar man dela upp grammatikaliska meningar (det vi i dagligt tal kallar meningar innehåller ofta flera grammatikaliska meningar) i olika satsdelar såsom subjekt, predikat och ackusativobjekt. Man brukar dela in ord i ordklasser (substantiv, adjektiv, verb, etcetera) efter hur de fungerar i satser.

Prosodi refererar till ett språks ljudegenskaper. Dessa kan delas upp i intonation, rytm och dynamik. Prosodi handlar om ljudenheters ljudegenskaper i förhållande till varandra. En ljudenhets prosodiska egenskaper kan yttra sig på stavelse-, ord-, fras- eller satsnivå. Prosodi syftar på vår förmåga att variera talet med hjälp av intonation, melodi, styrka och ironi. [källa: Wikipedia]

5 kommentarer

Filed under patent

5 responses to “Svenska dialektmaskiner

  1. Bertil Lyberg

    Verkligen kul, att mitt arbete på Telia Research under 90-talet uppmärksammas. Min egen dialekt är lite komplex. Uppväxt i Helsingborg, studier i Lund samt 40 år i Stockholmsregionen och nu bosatt i Norrland. Jag har dock en grundtonskurva som en stockholmare.
    Hälsningar
    Bertil

    • Stefan Hultquist

      Jättetrevligt att du responderar Bertil! Ja, ni västkustskåningar (Kattis Ahlström, Siw Malmkvist) verkar kunna välja när ni vill lägga bort dialekten. Eller köra den ”ända in i kaklet” som Gun Hellsvik och Hasse Alfredson🙂 Ha det så bra där uppe!
      /Stefan

  2. asarydenius

    Jag blev också glatt överraskad över ditt inlägg, Stefan. Språk och talteknologi är väldigt spännande. Ni har (minst) en gemensam nämnare du och Bertil Lyberg. Ni har båda varit min chef. Jag kan säga att Bertil inte brukade lägga bort dialekten i första taget🙂.
    /Åsa

    • Stefan Hultquist

      Haha! Ja, hur är det man säger: världen är ganska liten? Då vet vi vad vi ska prata om på nästa långlunch i alla fall! För övrigt behöver man ingen taligenkänningsutrustning för att känna igen Åsa – det är bara att lyssna efter någon som är glad och positiv hela tiden😉

  3. Pingback: Så ska det låta – Jens Waltin om övertoner i 2 § patentlagen | PRVbloggen