
2025-10-15
Betygssättning och respons på elevtexter är bland de mest tidskrävande sysslorna för en lärare. Tänk om en AI kunde ta över en del av det arbetet – skulle det spara tid eller riskera rättvisan? Bedömning med AI är ett nytt område där verktyg som studera.ai lovar att analysera elevtexter baserat på kunskapskrav och ge feedback automatiskt. I det här inlägget sammanfattar vi forskningsläget kring AI i bedömning, för- och nackdelar med AI-verktyg för betygsättning, samt framtida trender. Fokus ligger på situationen i Sverige, med en utblick mot internationella erfarenheter.
Svensk forskning har börjat undersöka AI:ns roll i bedömning. En nyligen genomförd studie jämförde en AI-modells bedömning av elevtexter med lärares bedömningar och fann både styrkor och begränsningar. AI:n låg relativt nära de mänskliga omdömena när det gällde att bedöma språkliga och strukturella aspekter, men hade svårare att bedöma innehållets kvalitet och ge detaljerad, kontextuell återkoppling. Studiens slutsats var att AI har potential att fungera som ett stödverktyg för lärare i bedömningen, men kan inte ersätta lärarens professionella expertis fullt ut.
Även AI-experter betonar att tekniken främst bör ses som ett komplement. Forskaren Olof Mogren påpekar till exempel att han inte skulle låta en chatbot sätta ett slutgiltigt betyg på en uppsats, men att AI kan hjälpa till med delmoment i bedömningen. Exempelvis kan en modell som ChatGPT sammanfatta vad en elevtext innehåller och vilka viktiga punkter eleven fått med eller missat – något som sparar tid i lärarens analys av många elevsvar.
I en amerikansk studie med 1 800 elevessayer visade det sig att den generativa AI-modellen ChatGPT kunde bedöma texter nästan i nivå med mänskliga lärare. Forskarna rapporterade att ChatGPT:s poängsättning i “grova drag var lika bra som en genomsnittligt stressad lärare” – dock inte tillräckligt pålitlig för att direkt användas i ett högrisk-sammanhang som nationella prov eller slutbetyg. För en uppsatsomgång var ChatGPT inom en poäng från en mänsklig bedömning i 89 % av texterna. I en annan omgång (med andra texter) var siffran lägre, cirka 76 %, vilket visar att AI:n i några fall gav annorlunda betyg än lärarna. Forskarna understryker därför att AI:ns omdömen i nuläget endast bör användas för “låga insatser” i klassrummet, som ett preliminärt utkastbetyg, och inte avgöra en elevs slutgiltiga betyg.

I Sverige har debatten om AI i skolan tagit fart efter att verktyg som ChatGPT blev allmänt tillgängliga. Skolverket har publicerat riktlinjer kring AI, där man betonar ett ansvarsfullt förhållningssätt. Bland annat påpekas att läraren alltid måste ha insyn och kontroll över hur AI används, särskilt i bedömningar. Officiellt avråder Skolverket från att låta en chattbot självständigt bedöma eller betygsätta elevprestationer, med hänvisning till osäkerheter kring rättssäkerhet och datasäkerhet.
Samtidigt finns en nyfikenhet bland många lärare att dra nytta av AI på ett säkert sätt. En del har börjat experimentera försiktigt med att använda verktyg som ChatGPT för att generera förslag på omdömen eller feedback på elevtexter. Dessa lärare betonar att AI:ns utlåtanden i så fall bara fungerar som ett utkast eller dubbelkoll – det slutliga omdömet justeras alltid av läraren själv, som kvalitetsgarant.
Trots de försiktiga tongångarna på policy-nivå har svenska edtech-aktörer börjat utveckla AI-verktyg för bedömning. Exempelvis låter tjänsten studera.ai lärare ladda upp en hel klass uppsatser och få dem analyserade utifrån Skolverkets kunskapskrav. Verktyget genererar omdömen, konkreta förbättringsförslag och annan feedback som läraren sedan kan granska och förmedla vidare. Tanken är att spara åtskilliga timmar av rättningsarbete varje vecka och samtidigt öka objektiviteten och likvärdigheten i bedömningen. Även andra projekt pågår – till exempel utvecklas språkgranskande AI-verktyg för att stötta rättning av engelska elevtexter – vilket visar att intresset för AI-bedömning finns, under förutsättning att det sker på ett ansvarsfullt sätt.
Runt om i världen pågår liknande diskussioner om AI i betygsättningen. I flera länder, bland annat USA, har automatiserad rättning av uppsatser använts i åratal i vissa standardiserade prov. Intresset för AI-drivna bedömningssystem har dock ökat explosionsartat i och med de nya generativa språkmodellerna. Tidiga resultat internationellt visar att sådana AI-modeller närmar sig mänsklig bedömningsprecision, och mycket tyder på att de kommer bli ännu bättre inom kort. Samtidigt varnar många experter globalt för att låta AI helt ta över bedömningen. Det finns en oro att AI-bedömning kan förstärka existerande orättvisor om den används okritiskt, snarare än att lösa dem. Därför rekommenderas att skolor och lärare använder AI som ett verktyg bland andra – inte som domare. Till exempel kan man låta AI ge formativ feedback på grammatik eller struktur, medan läraren själv ansvarar för den helhetsmässiga evalueringen. Samtidigt uppmanas edtech-utvecklare att noga utvärdera sina system ur ett rättviseperspektiv och inte bara optimera för genomsnittlig träffsäkerhet. Frågor som “för vilka elevgrupper fungerar AI-bedömningen bra eller dåligt?” har seglat upp som viktiga internationellt, så att inte vissa elever missgynnas av automatiserade system.
Framåt är det tydligt att AI kommer att spela en större roll inom bedömning, men exakt hur återstår att se. Många bedömare tror att den bästa modellen är människa + AI, där AI fungerar som en “medbedömare” (en slags copilot) som hjälper läraren snarare än ersätter hen. På så vis kan läraren dra nytta av AI:ns snabbhet och analyshjälp, samtidigt som det är läraren som tar de slutgiltiga besluten och står för det pedagogiska omdömet.
Samtidigt utvecklas AI-modellerna i rask takt. Kommande generationer språkmodeller kan bli bättre på att förstå elevtexters innehåll på djupet – nyanser, kontext och resonemang – vilket skulle kunna ge mer träffsäkra och rättvisa omdömen. Men detta förutsätter också att AI tränas på relevanta data (kanske svenska elevtexter och betygskriterier) och att vi har tydliga regelverk. Troligen kommer det ställas högre krav på transparens i hur AI bedömer, så att lärare och elever kan lita på systemen.
Lärarrollen kan också komma att förändras. Om en del av den rutinmässiga rättningen automatiseras, får lärare mer tid att fokusera på individuell återkoppling och djupare stöd till eleverna – sådant som AI inte kan ersätta. Samtidigt ökar behovet av fortbildning: framtidens lärare behöver kunskap om AI för att kunna använda tekniken kritiskt och effektivt i undervisningen. Som en norsk forskare uttryckte det: “det är utan tvivel så att robotar kommer att få en roll i att bedöma uppgifter i framtiden” – men det är upp till skolor och samhälle att avgöra hur den rollen ska se ut för att gagna elevernas lärande.

Skrivet av Peter Hellman
2025-10-15