header-pattern-bg

Utbredd användning av ChatGPT bland forskare

Del av fokusområde Smarta städer och samhällen

Sedan 2022 har OpenAI:s ChatGPT fått mycket uppmärksamhet. Detta beror på den avancerade språkmodellens förmåga att generera sammanhängande text om olika ämnen. Dess uppgång har dock inte varit okontroversiell, utan har bland annat väckt debatter om akademisk integritet. Trots detta kan ChatGPT, när det används på rätt sätt, vara ett kraftfullt verktyg och tillgång, menar Pablo Picazo Sanchez, doktor i datavetenskap.

LLM:er har visat potential när det gäller att förbättra vetenskapligt skrivande. De kan hjälpa forskare att spara tid och ansträngning genom att skapa sammanhängande och välstrukturerade texter. Det är dock viktigt att komma ihåg att dessa modeller är verktyg och att ansvaret för texten ytterst ligger hos författarna.

 

Pablo Picazo Sanchez

– Tillsammans med Lara Ortiz-Martin, doktor i datavetenskap vid Carlos III-universitetet i Madrid, har jag genomgört en studie där vi har undersökt ChatGPT:s inverkan på forskning. Vi har analyserat sammanfattningar på över 45 000 artiklar i 300 tidskrifter. Våra resultat visar att ChatGPT har använts i cirka 10 procent av de artiklar som har publicerats, vilket visar att verktyget redan används av många forskare, säger Pablo Picazo Sanchez.

En man med blå tröja står i halvprofil framför en kamera.

Pablo Picazo Sanchez ser både möjligheter och utmaningar med användning av ChatGPT inom forskarvärlden.

Thorsteinn Rögnvaldsson, professor i datavetenskap och vicerektor med ansvar för forskning och forskarutbildning vid Högskolan i Halmstad, tror att verktyget kommer att fortsätta att få fler användare inom akademin.

– De flesta anser inte att ChatGPT bidrar intellektuellt till forskningen. Det är ”bara” ett verktyg som med ord eller siffror kan formulera de idéer som författarna har. Verktyget är tillgängligt för att utnyttjas i den vetenskapliga publiceringskarusellen – och det kommer att utnyttjas. Över tid förutser jag att fler och fler forskare kommer att använda det och till slut kommer alla att använda det i alla delar av forskning och utbildning, inklusive granskning och betygsättning, säger Thorsteinn Rögnvaldsson.

Brist på transparens

I takt med att tekniker för behandling av naturligt språk (på engelska: natural language processing, NLP) blir allt vanligare i vetenskapligt skrivande använder många författare dessa verktyg utan att redogöra för det ordentligt. Bristen på transparens väcker frågor om trovärdigheten i vetenskapliga dokument och understryker behovet av mer transparenta metoder för rapportering.

– Trots ansträngningar för att identifiera text som genereras av stora språkmodeller (på engelska: large language models, LLM:s) är det fortfarande en utmaning med LLM:er, som ChatGPT, att skilja mellan material som är skrivet av en människa och AI-genererat innehåll. Det kan väcka frågor om författarskap och trovärdighet, säger Pablo Picazo Sanchez.

En stor del av vetenskapliga artiklar skrivs på engelska. Pablo Picazo Sanchez berättar att det finns en uppfattning om att författare från engelskspråkiga länder inte använder ChatGPT i sin skrivprocess i lika stor utsträckning som icke-engelskspråkiga. Det verkar dock inte stämma . Istället betonar Pablo Picazo Sanchez AI-verktygens utbredda användning och nytta inom vetenskaplig kommunikation.

– LLM:er har visat potential när det gäller att förbättra vetenskapligt skrivande. De kan hjälpa forskare att spara tid och ansträngning genom att skapa sammanhängande och välstrukturerade texter. Det är dock viktigt att komma ihåg att dessa modeller är verktyg och att ansvaret för texten ytterst ligger hos författarna, säger Pablo Picazo Sanchez.

– Resultaten är inte på något sätt överraskande. Man kan jämföra detta med forskningsassistenter. Jag tror att det har funnits gott om fall tidigare när forskningsassistenter har skrivit text, gjort experiment eller litteraturöversikter som har gett forskningsresultat, utan att nämnas som författare. Möjligen har de fått ett erkännande, säger Thorsteinn Rögnvaldsson.

”Författare måste alltid ha kontroll över innehållet”

Studiens resultat belyser den snabba integrationen av AI-verktyg i den akademiska skrivprocessen. Med utvecklingen av NLP-teknik och den växande närvaron av AI-modeller som ChatGPT är det viktigt att inte bara omfamna dessa verktyg utan också förutse deras fortsatta utveckling.

Pablo Picazo Sanchez föreslår att man behöver utveckla strategier för att hantera de utmaningar som är förknippade med ökad AI-användning inom forskning. Det gäller även sådant som att identifiera medförfattarskap och bekämpa spridningen av falska nyheter och falska akademiska artiklar.

– Författare måste alltid behålla kontrollen över det innehåll som de publicerar och se till att deras arbete är unikt, korrekt och uppfyller normerna för akademisk integritet. Genom att göra det kan vi utnyttja AI-verktygens potential samtidigt som vi upprätthåller trovärdigheten inom forskningen, säger Pablo Picazo Sanchez.

– Jag tycker att alla skrivhjälpmedel är okej så länge den slutliga texten kan betecknas som originalverk av författarna. Du kan inte klistra in stora bitar av text direkt och hävda att du har skrivit den utan att kreditera ChatGPT eller något liknande. Författarna måste läsa texten, bearbeta den och anpassa den så att den passar deras uttryckssätt. Eller så ska de tydligt ange att ChatGPT skrev texten utifrån en prompt, alltså en instruktion. Kanske ska de också tillhandahålla prompten i det kompletterande materialet för att tydliggöra sin intellektuella input i skrivprocessen. Det här betyder inte att jag uppmanar alla att använda ChatGPT eller liknande verktyg. Däremot förstår jag att det kan hända på grund av den konstanta pressen på effektivitet, som driver människor att producera mer och mer, snabbare och snabbare. Det är ett faktum, säger Thorsteinn Rögnvaldsson.

– Att inte göra det kan leda till att man förlorar och underminerar forskningens trovärdighet, säger Pablo Picazo Sanchez.

Undersöker vilseledande information

Pablo Picazo Sanchez fortsätter sin forskning om LLM:er och kommer att fokusera på hallucinationer, det vill säga fiktivt eller vilseledande innehåll, som produceras av LLM:er under automatisk referensgenerering.

– Vårt mål är att förstå hur dessa modeller skapar och modifierar texten och deras potentiella inverkan på noggrannheten i vetenskapliga referenser, säger Pablo Picazo Sanchez och fortsätter:

– Vi hoppas kunna belysa utmaningarna och begränsningarna med att använda LLM:er för referensgenerering och identifiera strategier för att förbättra kvaliteten och trovärdigheten hos genererade referenser.

Text: ANNA-FRIDA AGARDSON

Toppbild: ISTOCK

Porträttbild: PRIVAT