Bedömning med AI – revolution eller risk?

Peter Hellman

2025-10-15

Innehållsförteckning

Betygssättning och respons på elevtexter är bland de mest tidskrävande sysslorna för en lärare. Tänk om en AI kunde ta över en del av det arbetet – skulle det spara tid eller riskera rättvisan? Bedömning med AI är ett nytt område där verktyg som studera.ai lovar att analysera elevtexter baserat på kunskapskrav och ge feedback automatiskt. I det här inlägget sammanfattar vi forskningsläget kring AI i bedömning, för- och nackdelar med AI-verktyg för betygsättning, samt framtida trender. Fokus ligger på situationen i Sverige, med en utblick mot internationella erfarenheter.

Forskning: Hur bra är AI på att bedöma elevtexter?

Svensk forskning har börjat undersöka AI:ns roll i bedömning. En nyligen genomförd studie jämförde en AI-modells bedömning av elevtexter med lärares bedömningar och fann både styrkor och begränsningar. AI:n låg relativt nära de mänskliga omdömena när det gällde att bedöma språkliga och strukturella aspekter, men hade svårare att bedöma innehållets kvalitet och ge detaljerad, kontextuell återkoppling. Studiens slutsats var att AI har potential att fungera som ett stödverktyg för lärare i bedömningen, men kan inte ersätta lärarens professionella expertis fullt ut.

Även AI-experter betonar att tekniken främst bör ses som ett komplement. Forskaren Olof Mogren påpekar till exempel att han inte skulle låta en chatbot sätta ett slutgiltigt betyg på en uppsats, men att AI kan hjälpa till med delmoment i bedömningen. Exempelvis kan en modell som ChatGPT sammanfatta vad en elevtext innehåller och vilka viktiga punkter eleven fått med eller missat – något som sparar tid i lärarens analys av många elevsvar.

I en amerikansk studie med 1 800 elevessayer visade det sig att den generativa AI-modellen ChatGPT kunde bedöma texter nästan i nivå med mänskliga lärare. Forskarna rapporterade att ChatGPT:s poängsättning i “grova drag var lika bra som en genomsnittligt stressad lärare” – dock inte tillräckligt pålitlig för att direkt användas i ett högrisk-sammanhang som nationella prov eller slutbetyg. För en uppsatsomgång var ChatGPT inom en poäng från en mänsklig bedömning i 89 % av texterna. I en annan omgång (med andra texter) var siffran lägre, cirka 76 %, vilket visar att AI:n i några fall gav annorlunda betyg än lärarna. Forskarna understryker därför att AI:ns omdömen i nuläget endast bör användas för “låga insatser” i klassrummet, som ett preliminärt utkastbetyg, och inte avgöra en elevs slutgiltiga betyg.

Fördelar med AI i bedömning

  • Tidsbesparing: AI kan rätta stora mängder text mycket snabbare än en människa. Till exempel skulle en högstadielärare kunna behöva över 50 timmars arbete för att bedöma 150 elevarbeten manuellt, medan en AI kan göra en första genomläsning och bedömning på bråkdelen av tiden.
  • Snabb återkoppling: Eleverna kan få feedback nästan omedelbart genom AI-verktyg, istället för att vänta dagar eller veckor på lärarens respons. Det möjliggör att eleverna snabbare kan revidera sina texter och lära sig av sina misstag direkt.
  • Ökad likvärdighet: En AI bedömer utifrån samma matris och kriterier varje gång och kan därmed potentiellt ge mer konsekventa bedömningar mellan olika elever än vad stressade lärare orkar upprätthålla. AI:n påverkas inte av omedvetna favoriseringar eller dagsform på samma sätt som en människa kan göra (förutsatt att AI:n är rätt tränad och fri från bias).
  • Träffsäkra omdömen: Erfarenheter tyder på att en välkonfigurerad AI faktiskt ofta hamnar nära lärarens egen bedömning. I ett norskt klassrumsexperiment gav ChatGPT liknande betyg och kommentarer som lärarna själva – till och med eleverna noterade att “roboten” var “ganska rätt ute” i sin analys. Detta tyder på att AI:n kan ge relevant återkoppling som överensstämmer med lärarens uppfattning.
  • Mer skrivträning: Om rättningsbördan minskar kan lärare våga ge fler skrivuppgifter åt eleverna. Forskare pekar på att AI-stöd kan frigöra tid och “ge lärare mer utrymme att låta eleverna skriva mer”, vilket i längden gynnar elevernas lärande.

Nackdelar och utmaningar med AI-bedömning

  • Inkonsekvens och opålitlighet: Dagens generativa AI kan ge olika resultat från gång till gång. Exempelvis fick en norsk elev två olika betyg (först en femma, sedan en fyra) när hon skickade in samma text till ChatGPT vid två tillfällen. Sådan oförutsägbar variation gör att man inte kan lita blint på AI:ns omdömen.
  • Bristande djupförståelse: En AI “förstår” inte text på samma sätt som en människa. Modellerna kan missa kontext, nyanser och kreativitet i elevsvaren. En svensk studie visade att AI:n hade svårt att bedöma innehållsliga kvaliteter i texterna, och andra erfarenheter visar att ChatGPT tenderar att ge mellanmjuka standardomdömen istället för att känna igen riktigt lysande eller riktigt svaga texter. Detta innebär att en toppuppsats kanske inte får den höga uppskattning den förtjänar, eller att allvarliga brister inte upptäcks, om man förlitar sig på AI:n.
  • Risk för bias: AI-modeller tränas på data som kan innehålla omedvetna fördomar. Därför kan AI:n reproducera orättvisor om den inte hanteras försiktigt. En analys av 24 000 elevtexter i USA fann till exempel att ChatGPT konsekvent gav något lägre poäng till texter skrivna av svarta elever jämfört med asiatiska elever. Skillnaden motsvarade den snedfördelning som även mänskliga bedömare gjort tidigare, vilket betyder att AI:n ärver människans bias. Om sådana tendenser ignoreras riskerar redan missgynnade elevgrupper att fortsätta missgynnas.
  • Mänsklig faktor behövs: Automatiken kan inte ersätta en lärares professionella bedömningsförmåga och pedagogiska blick. Till syvende och sist måste en människa avgöra vilket betyg som sätts och kunna motivera det för eleven. Lärare framhåller att AI-feedback kan vara ett bra stöd, men att det “verkliga avgörandet” i bedömningen alltid måste göras av läraren. Dessutom får man inte glömma det personliga i feedback: en AI kan ge ett “bra jobbat” på skärmen, men det ersätter inte känslan av att få beröm eller konstruktiv kritik direkt från en lärare i klassrummet.
  • Sekretess och policy: Ett praktiskt hinder är frågan om dataskydd och regelverk. Att ladda upp elevarbeten i en AI-tjänst kan strida mot lagar om personuppgifter om inte elever/vårdnadshavare gett samtycke. Skolverket har gått ut med tydliga råd att chattbottar inte ska användas för att bedöma elevarbeten i skolan, åtminstone inte förrän det finns säkra riktlinjer för hantering av data och rättssäkerhet. Många skolor avvaktar därför med att införa AI-bedömning tills regelverket och etiken hunnit ikapp tekniken.

AI-bedömning i Sverige

I Sverige har debatten om AI i skolan tagit fart efter att verktyg som ChatGPT blev allmänt tillgängliga. Skolverket har publicerat riktlinjer kring AI, där man betonar ett ansvarsfullt förhållningssätt. Bland annat påpekas att läraren alltid måste ha insyn och kontroll över hur AI används, särskilt i bedömningar. Officiellt avråder Skolverket från att låta en chattbot självständigt bedöma eller betygsätta elevprestationer, med hänvisning till osäkerheter kring rättssäkerhet och datasäkerhet.

Samtidigt finns en nyfikenhet bland många lärare att dra nytta av AI på ett säkert sätt. En del har börjat experimentera försiktigt med att använda verktyg som ChatGPT för att generera förslag på omdömen eller feedback på elevtexter. Dessa lärare betonar att AI:ns utlåtanden i så fall bara fungerar som ett utkast eller dubbelkoll – det slutliga omdömet justeras alltid av läraren själv, som kvalitetsgarant.

Trots de försiktiga tongångarna på policy-nivå har svenska edtech-aktörer börjat utveckla AI-verktyg för bedömning. Exempelvis låter tjänsten studera.ai lärare ladda upp en hel klass uppsatser och få dem analyserade utifrån Skolverkets kunskapskrav. Verktyget genererar omdömen, konkreta förbättringsförslag och annan feedback som läraren sedan kan granska och förmedla vidare. Tanken är att spara åtskilliga timmar av rättningsarbete varje vecka och samtidigt öka objektiviteten och likvärdigheten i bedömningen. Även andra projekt pågår – till exempel utvecklas språkgranskande AI-verktyg för att stötta rättning av engelska elevtexter – vilket visar att intresset för AI-bedömning finns, under förutsättning att det sker på ett ansvarsfullt sätt.

Internationella perspektiv

Runt om i världen pågår liknande diskussioner om AI i betygsättningen. I flera länder, bland annat USA, har automatiserad rättning av uppsatser använts i åratal i vissa standardiserade prov. Intresset för AI-drivna bedömningssystem har dock ökat explosionsartat i och med de nya generativa språkmodellerna. Tidiga resultat internationellt visar att sådana AI-modeller närmar sig mänsklig bedömningsprecision, och mycket tyder på att de kommer bli ännu bättre inom kort. Samtidigt varnar många experter globalt för att låta AI helt ta över bedömningen. Det finns en oro att AI-bedömning kan förstärka existerande orättvisor om den används okritiskt, snarare än att lösa dem. Därför rekommenderas att skolor och lärare använder AI som ett verktyg bland andra – inte som domare. Till exempel kan man låta AI ge formativ feedback på grammatik eller struktur, medan läraren själv ansvarar för den helhetsmässiga evalueringen. Samtidigt uppmanas edtech-utvecklare att noga utvärdera sina system ur ett rättviseperspektiv och inte bara optimera för genomsnittlig träffsäkerhet. Frågor som “för vilka elevgrupper fungerar AI-bedömningen bra eller dåligt?” har seglat upp som viktiga internationellt, så att inte vissa elever missgynnas av automatiserade system.

Framtid och trender

Framåt är det tydligt att AI kommer att spela en större roll inom bedömning, men exakt hur återstår att se. Många bedömare tror att den bästa modellen är människa + AI, där AI fungerar som en “medbedömare” (en slags copilot) som hjälper läraren snarare än ersätter hen. På så vis kan läraren dra nytta av AI:ns snabbhet och analyshjälp, samtidigt som det är läraren som tar de slutgiltiga besluten och står för det pedagogiska omdömet.

Samtidigt utvecklas AI-modellerna i rask takt. Kommande generationer språkmodeller kan bli bättre på att förstå elevtexters innehåll på djupet – nyanser, kontext och resonemang – vilket skulle kunna ge mer träffsäkra och rättvisa omdömen. Men detta förutsätter också att AI tränas på relevanta data (kanske svenska elevtexter och betygskriterier) och att vi har tydliga regelverk. Troligen kommer det ställas högre krav på transparens i hur AI bedömer, så att lärare och elever kan lita på systemen.

Lärarrollen kan också komma att förändras. Om en del av den rutinmässiga rättningen automatiseras, får lärare mer tid att fokusera på individuell återkoppling och djupare stöd till eleverna – sådant som AI inte kan ersätta. Samtidigt ökar behovet av fortbildning: framtidens lärare behöver kunskap om AI för att kunna använda tekniken kritiskt och effektivt i undervisningen. Som en norsk forskare uttryckte det: “det är utan tvivel så att robotar kommer att få en roll i att bedöma uppgifter i framtiden” – men det är upp till skolor och samhälle att avgöra hur den rollen ska se ut för att gagna elevernas lärande.

Källor

Skrivet av Peter Hellman

2025-10-15
Relaterade artiklar
AI i skolan 2025 – möjligheter och utmaningar

Artificiell intelligens (AI) håller på att förändra skolans värld i grunden. Både i Sverige och globalt har AI-verktyg snabbt gått från nyhet till vardag i klassrummet...

Kan en AI sätta betyg? Möjligheter och fallgropar i automatisk bedömning

Betygssättning och respons på elevuppgifter är bland de mest tidskrävande sysslorna för en lärare. Tänk om en AI kunde ta över en del av det arbetet – skulle det vara en revolution eller en risk? Redan idag experimenterar många lärare...

Så förändrar AI skolan inom tre år – möjligheter och farhågor

Inom några år kan AI bli lika självklar i klassrummet som whiteboarden är idag. Som gymnasielärare ser jag redan hur artificiell intelligens smyger sig in i skolans värld – ibland som en ovärderlig assistent, ibland som en källa till huvudbry. Den här texten är en framtidsblick mot år 2028