În aprilie, Anthropic a lansat Project Glasswing, o inițiativă prin care companiile pot folosi noul model AI Mythos pentru a găsi și remedia vulnerabilitățile din propriul software. Anunțul a fost un excelent exercițiu de PR, iar multe publicații au preluat necritic afirmațiile Anthropic, transformând în „înțelepciune comună” ideea că Mythos este cel mai bun la detectarea vulnerabilităților. Realitatea este însă mai complexă.
Ce arată raportul oficial
Recent, Anthropic a publicat un raport de progres al Proiectului Glasswing. Conform acestuia, Mythos a identificat un număr semnificativ de vulnerabilități în diverse aplicații. Unele dintre acestea sunt chiar periculoase, dar aproape niciuna nu reprezintă o amenințare critică. Cu alte cuvinte, modelul găsește multe probleme, însă rareori descoperă breșe care ar putea fi exploatate cu ușurință.
Comparația cu alte modele
Afirmația că Mythos este superior altor modele AI în detectarea vulnerabilităților software nu este susținută de dovezi concludente. Experții în securitate subliniază că eficiența unui astfel de sistem depinde de mulți factori, inclusiv de tipul de software analizat și de setul de date de antrenament. Fără o comparație riguroasă, declarațiile rămân în sfera marketingului.
Context și implicații
Project Glasswing face parte dintr-o tendință mai largă de a integra inteligența artificială în securitatea cibernetică. Ideea de a automatiza găsirea vulnerabilităților este promițătoare, dar rezultatele actuale arată că suntem încă departe de o soluție magică. Pentru companii, asta înseamnă că Mythos poate fi un instrument util, dar nu un înlocuitor pentru auditurile de securitate tradiționale.
Concluzie
Anthropic a reușit să atragă atenția asupra potențialului AI în securitatea software, dar realitatea Proiectului Glasswing este mai puțin spectaculoasă decât sugerează titlurile. Vulnearbilitățile găsite sunt reale, dar rareori critice. Rămâne de văzut dacă următoarele versiuni ale modelului vor îmbunătăți semnificativ capacitatea de a detecta amenințări grave.