Istraživanje: AI asistenti masovno griješe u vijestima
Vodeći AI asistenti pogrešno prikazuju sadržaj vijesti u gotovo polovini svojih odgovora, pokazalo je istraživanje objavljeno u srijedu koje su proveli Evropska radiodifuzijska unija (EBU) i BBC. Međunarodno istraživanje analiziralo je tri hiljade odgovora na pitanja o vijestima postavljena najpoznatijim AI asistentima – softverskim aplikacijama koje koriste umjetnu inteligenciju za razumijevanje prirodnog jezika i obavljanje zadataka za korisnika.
Procijenjeni su AI asistenti na 14 jezika prema kriterijima tačnosti, navođenja izvora i sposobnosti razlikovanja mišljenja od činjenica, među kojima su ChatGPT, Copilot, Gemini i Perplexity. Ukupno je 45 odsto analiziranih AI odgovora sadržavalo barem jednu ozbiljnu pogrešku, dok je 81 odsto imalo neki oblik problema, pokazalo je istraživanje.
Reuters je kontaktirao kompanije uključene u istraživanje kako bi zatražio njihov komentar o rezultatima istraživanja. Gemini, Googleov AI asistent, ranije je na svojoj internetskoj stranici naveo da pozdravlja povratne informacije korisnika kako bi se platforma mogla nastaviti poboljšavati i postati korisnija.
OpenAI i Microsoft su prethodno izjavili da su takozvane “halucinacije”, situacije u kojima AI model generiše netačne ili zavaravajuće informacije zbog, na primjer, nedostatka podataka – problem na kojem aktivno rade kako bi ga otklonili. Perplexity na svojoj stranici navodi da jedan od njegovih načina rada, nazvan “Deep Research”, ima tačnost od 93,9 odsto u pogledu činjenica.
Najviše problema s izvorima ima Googleov Gemini
Trećina odgovora AI asistenata pokazala je ozbiljne pogreške u navođenju izvora, poput izostanka izvora, pogrešnog ili netačnog navođenja, navodi se u istraživanju. Čak 72 odsto odgovora Geminija, Googleova AI asistenta, imalo je značajne probleme s izvorima, u poređenju s manje od 25 posto kod svih ostalih asistenata.
Problemi s tačnošću utvrđeni su u 20 odsto svih analiziranih odgovora, uključujući slučajeve zastarjelih informacija. Primjeri navedeni u istraživanju uključuju situaciju u kojoj je Gemini pogrešno naveo izmjene zakona o jednokratnim e-cigaretama te slučaj kada je ChatGPT nekoliko mjeseci nakon smrti pape Franje i dalje navodio da je on aktuelni papa.
U istraživanju su učestvovala 22 javna medijska servisa iz 18 zemalja, među kojima su Francuska, Njemačka, Španija, Ukrajina, Velika Britanija i Sjedinjene Američke Države. Kako AI asistenti sve više zamjenjuju tradicionalne internetske pretraživače u pristupu vijestima, javno povjerenje moglo bi biti ozbiljno narušeno, upozorio je EBU.
“Kada ljudi više ne znaju čemu mogu vjerovati, na kraju ne vjeruju ničemu, a to može obeshrabriti sudjelovanje u demokratskim procesima”, izjavio je direktor EBU-a za medije Jean Philip De Tender.
AI postaje novi izvor vijesti, posebno za mlađe
Prema Digital News Reportu 2025. Reutersova instituta, oko sedam posto svih korisnika interneta koji prate vijesti i čak 15 posto onih mlađih od 25 godina koristi AI asistente za informisanje o aktuelnostima. Novi izvještaj poziv je AI kompanije na veću odgovornost i poboljšanje načina na koji njihovi asistenti odgovaraju na pitanja povezana s vijestima.