Istraživanje: AI asistenti masovno griješe u vijestima

OpenAI razvio zastrašujući alat/ Wiki Commons/
ilustracija
Nastavak vijesti ispod promo sadržaja

Vodeći AI asistenti pogrešno prikazuju sadržaj vijesti u gotovo polovini svojih odgovora, pokazalo je istraživanje objavljeno u srijedu koje su proveli Evropska radiodifuzijska unija (EBU) i BBC. Međunarodno istraživanje analiziralo je tri hiljade odgovora na pitanja o vijestima postavljena najpoznatijim AI asistentima – softverskim aplikacijama koje koriste umjetnu inteligenciju za razumijevanje prirodnog jezika i obavljanje zadataka za korisnika.

 

 

Procijenjeni su AI asistenti na 14 jezika prema kriterijima tačnosti, navođenja izvora i sposobnosti razlikovanja mišljenja od činjenica, među kojima su ChatGPT, Copilot, Gemini i Perplexity. Ukupno je 45 odsto analiziranih AI odgovora sadržavalo barem jednu ozbiljnu pogrešku, dok je 81 odsto imalo neki oblik problema, pokazalo je istraživanje.

 

Nastavak vijesti ispod promo sadržaja

 

Reuters je kontaktirao kompanije uključene u istraživanje kako bi zatražio njihov komentar o rezultatima istraživanja. Gemini, Googleov AI asistent, ranije je na svojoj internetskoj stranici naveo da pozdravlja povratne informacije korisnika kako bi se platforma mogla nastaviti poboljšavati i postati korisnija.

 

 

OpenAI i Microsoft su prethodno izjavili da su takozvane “halucinacije”, situacije u kojima AI model generiše netačne ili zavaravajuće informacije zbog, na primjer, nedostatka podataka – problem na kojem aktivno rade kako bi ga otklonili. Perplexity na svojoj stranici navodi da jedan od njegovih načina rada, nazvan “Deep Research”, ima tačnost od 93,9 odsto u pogledu činjenica.

Nastavak vijesti ispod promo sadržaja

 

 

Najviše problema s izvorima ima Googleov Gemini

 

 

Nastavak vijesti ispod promo sadržaja

Trećina odgovora AI asistenata pokazala je ozbiljne pogreške u navođenju izvora, poput izostanka izvora, pogrešnog ili netačnog navođenja, navodi se u istraživanju. Čak 72 odsto odgovora Geminija, Googleova AI asistenta, imalo je značajne probleme s izvorima, u poređenju s manje od 25 posto kod svih ostalih asistenata.

 

 

Problemi s tačnošću utvrđeni su u 20 odsto svih analiziranih odgovora, uključujući slučajeve zastarjelih informacija. Primjeri navedeni u istraživanju uključuju situaciju u kojoj je Gemini pogrešno naveo izmjene zakona o jednokratnim e-cigaretama te slučaj kada je ChatGPT nekoliko mjeseci nakon smrti pape Franje i dalje navodio da je on aktuelni papa.

 

Nastavak vijesti ispod promo sadržaja

 

U istraživanju su učestvovala 22 javna medijska servisa iz 18 zemalja, među kojima su Francuska, Njemačka, Španija, Ukrajina, Velika Britanija i Sjedinjene Američke Države. Kako AI asistenti sve više zamjenjuju tradicionalne internetske pretraživače u pristupu vijestima, javno povjerenje moglo bi biti ozbiljno narušeno, upozorio je EBU.

 

 

“Kada ljudi više ne znaju čemu mogu vjerovati, na kraju ne vjeruju ničemu, a to može obeshrabriti sudjelovanje u demokratskim procesima”, izjavio je direktor EBU-a za medije Jean Philip De Tender.

Nastavak vijesti ispod promo sadržaja

 

 

AI postaje novi izvor vijesti, posebno za mlađe

 

 

Prema Digital News Reportu 2025. Reutersova instituta, oko sedam posto svih korisnika interneta koji prate vijesti i čak 15 posto onih mlađih od 25 godina koristi AI asistente za informisanje o aktuelnostima. Novi izvještaj poziv je AI kompanije na veću odgovornost i poboljšanje načina na koji njihovi asistenti odgovaraju na pitanja povezana s vijestima.