Berättelser
Berättelser kring livet i nationen
Nationer hålls samman av berättelser: folkhemmet, den svenska sommaren, jantelagen, bilden av det rationella moderna landet. Generativa modeller blir nu medberättare. Frågan är vems arkiv de berättar ur, och på vems språk.
Hur AI skulle kunna förändra detta
Det mesta av träningsdatan bakom de stora modellerna är engelskspråkig, och svenskan riskerar att bli ett översättningsspråk med utslätade nyanser. Motdraget är inhemskt: AI Swedens GPT-SW3 är den första stora generativa språkmodellen för svenska, öppet släppt i sex storlekar, och handlingsplanen för AI-strategin ger Kungliga biblioteket och Riksarkivet i uppdrag att göra det svenska kulturarvet användbart som träningsdata.
Arkiven öppnar sig samtidigt åt andra hållet. Riksarkivet använder AI för att tolka handskrifter från 1600- till 1800-tal, och plötsligt kan fler än specialister läsa breven, domböckerna och bouppteckningarna. Fler kan berätta. Men MPF varnar för en offentlighet översvämmad av syntetiska bilder och texter, där källkritik blir en folkkunskap lika grundläggande som läsförståelse.
Frågor att diskutera
Vilka svenska berättelser och perspektiv saknas i träningsdatan, och vem märker att de saknas?
Hur förändras nationens självbild när vem som helst kan generera ”svenskhet” på beställning?
Vad vinner och förlorar minoritetsspråken i Sverige när språkmodeller tränas främst på majoritetsspråket?
Vem ska avgöra vad som ingår när kulturarvet blir träningsdata: arkivarier, politiker eller modellbyggare?
Hur berättas Sveriges historia när arkiven blivit sökbara för alla och förfalskningar blivit lika lätta?
Att tänka på
- Språkmodeller är kulturpolitik: den som tränar modellen väljer indirekt vilka röster som hörs.
- Digitaliserade arkiv är dubbelriktade: de gör historien tillgänglig och gör den samtidigt till råvara.
- Berättelserna om AI formar AI-politiken. Skräck och frälsning är båda dåliga rådgivare.