AI mund të tejkalojë ekspertët njerëzorë brenda një viti

AutoTech

Gazeta Express

30/03/2026 22:32

AI mund të tejkalojë ekspertët njerëzorë brenda një viti

AutoTech

Gazeta Express

30/03/2026 22:32

Ekspertët paralajmërojnë se inteligjenca artificiale (AI) mund të jetë gati të marrë pikët maksimale në një nga testet më sfiduese të dijes, të njohur si “Humanity’s Last Exam” (HLE), brenda vetëm disa muajsh.

HLE u krijua nga drejtues të teknologjisë për të testuar nivelin e inteligjencës së sistemeve të tyre dhe përfshin 2,500 pyetje të përzgjedhura me kujdes, që mbulojnë rreth njëqind fusha – nga raketat dhe mitologjia deri te fiziologjia.

Çdo pyetje kërkon të paktën njohuri në nivel doktorature, dhe arritja e një rezultati pranë 100% do të garantonte titullin “ekspert universal”.

Vetëm dy vjet më parë, sistemi ChatGPT i OpenAI mori vetëm 3% pikë në test, ndërsa konkurrentët e tij në Google dhe Anthropic nuk performuan shumë më mirë. Testi shërbeu për të qetësuar frikën nga dominimi në rritje i AI-së, duke treguar një “hendek të dukshëm” midis modeleve të mëdha gjuhësore dhe akademikëve më të mirë në botë.

Por HLE-ja, që dukej e pamundur, mund të bëhet një tjetër pikë kthese në ngritjen e pakontrolluar të AI-së.

Google Gemini arriti 45.9% në test muajin e kaluar, duke u përmirësuar nga 18.8% brenda disa muajve pas përpjekjes së parë.

Sipas Calvin Zhang, drejtues i kërkimeve në Scale – kompania pas HLE-së – pikët maksimale janë brenda horizontit: “Ne donim të krijonim këtë standard akademik të mbyllur, në kufijtë e ekspertizës njerëzore, që vetëm pak njerëz në botë mund ta zgjidhnin.”

Kate Olszewska nga Google DeepMind shtoi: “Nëse do të fokusoheshim vetëm te kjo gjë, mund ta arrinim mjaft shpejt.”

Anthropic, kompania pas sistemit Claude AI, ka arritur 34.2% dhe po përmirëson shpejt rezultatet e saj.

Nëse AI arrin 100% pikë, kjo do të shënonte një zhvillim historik, pasi testi është “projekti final i një standardi akademik të mbyllur të këtij lloji”. Kjo do të thotë se në të ardhmen AI duhet të testohet me pyetje për të cilat asnjë njeri nuk ka përgjigje.

Testi u krijua nga Scale dhe Center for AI Safety për të vlerësuar jo vetëm sasinë e dijes, por edhe thellësinë e arsyetimit të AI-së. Ekspertë nga rreth 50 vende dorëzuan 70,000 pyetje, nga të cilat u përzgjodhën 2,500 më sfiduese dhe të panjohura publikisht për të parandaluar shpërndarjen e përgjigjeve online.

Suksesi në HLE do të kujtonte fitoret historike të kompjuterit Deep Blue ndaj kampionit të shahut Garry Kasparov në 1997, duke sfiduar parashikimet e shumicës së ekspertëve.

Sot, ndërsa AI afrohet në nivelin ku mund të zotërojë testet njerëzore dhe të shkojë përtej kufijve të njohurive të njeriut, zhvilluesit përqendrohen gjithnjë e më shumë te zgjerimi i kapacitetit të saj. Megjithatë, fushat fizike si kirurgjia dhe aftësitë e vendimmarrjes, përfshirë gjykimin dhe kreativitetin, mbeten sfida të vështira për AI-në, sipas Zhang. /GazetaExpress/