Süni intellekt uzun dialoqlarda dəqiqliyini itirir - Araşdırma
Süni intellekt uzun dialoqlarda dəqiqliyini itirir - Araşdırma

"Microsoft Research" və "Salesforce" tərəfindən aparılan araşdırma göstərib ki, müasir süni intellekt modelləri uzunmüddətli dialoqlarda nəzərəçarpacaq dərəcədə dəqiqliyini itirir. "GPT-4.1", "Gemini 2.5 Pro", "Claude 3.7 Sonnet", "o3", "DeepSeek R1" və "Llama 4" kimi qabaqcıl sistemlərin iştirakı ilə 200 mindən çox danışıq təhlil olunub.

Bizimyol.info xəbər veir ki, alimlər müəyyən ediblər ki, qarşılıqlı əlaqə mürəkkəbləşdikcə sistemlər tez-tez söhbətin tərcüməsində qeyri-dədiqliyə yol verir.

Tək sorğuların emalı zamanı modellər təxminən 90% uğur göstəricisi nümayiş etdirir. Lakin uzun dialoqlarda bu göstərici təxminən 65%-ə enir. Maraqlıdır ki, ümumi dəqiqlik cəmi 15% azalsa da, etibarsızlıq səviyyəsi 112% artır.

Tədqiqatçılar bunu süni intellektin cavabları vaxtından əvvəl formalaşdırmaq meyli ilə izah edirlər — modellər istifadəçi sorğunu tam ifadə etməmiş həll yolu təklif etməyə çalışır. Bundan əlavə, ilkin cavab səhv olsa belə, sonrakı replikalarda çox vaxt həmin cavab əsas kimi götürülür.

Araşdırmada həmçinin “cavabların şişməsi” effekti qeydə alınıb. Çoxmərhələli ünsiyyət zamanı mətnlər daha uzun olur, daha çox ehtimal və qeyri-dəqiqlik ehtiva edir və bunlar dialoqun kontekstində möhkəmlənir. Qeyd olunur ki, əlavə “düşüncə tokenləri”nə malik "o3" və "DeepSeek R1" kimi modellər belə bu problemdən tam yayınmağı bacarmayıb.

Müəlliflər vurğulayırlar ki, nəticələrdəki fərqlər modelin qəfil “daha az intellektual” olması demək deyil. Bu, daha çox mürəkkəb dialoq ssenarilərində mövcud arxitektura məhdudiyyətlərini göstərir. Araşdırma həmçinin əvvəlki iddiaları təsdiqləyir ki, istifadəçi səhvləri və mürəkkəb sorğu formaları cavabların keyfiyyətinə birbaşa təsir edə bilər.

Qadir, Bizimyol.info