Sari la continut
sâmbătă, 13 iunie 2026
TechInfos.ro

Laboratorul stirilor tech

Inovatie

NVFP4 pe NVIDIA Blackwell: Cum accelerează antrenarea LLM-urilor cu 4 biți

Nvidia introduce suportul pentru formatul NVFP4 pe arhitectura Blackwell, permițând antrenarea mai rapidă a modelelor lingvistice mari prin reducerea lățimii de bandă și creșterea throughput-ului.

TI 9 iunie 2026 4 min read

Antrenarea modelelor lingvistice de ultimă generație (LLM) este o cursă contra cronometru: fiecare procent de îmbunătățire a throughput-ului contează atunci când vorbim de trilioane de tokeni și mii de acceleratoare. Nvidia a anunțat recent suportul pentru formatul de precizie redusă NVFP4 pe arhitectura Blackwell, integrat în framework-urile JAX și MaxText. Ce înseamnă acest lucru pentru dezvoltatori?

Ce este NVFP4 și cum funcționează?

NVFP4 este un format de date cuantizat pe 4 biți, conceput pentru a accelera calculele de tip matriceal din antrenarea rețelelor neuronale. Spre deosebire de FP16 sau BF16, NVFP4 folosește doar 4 biți per valoare, reducând drastic lățimea de bandă a memoriei și consumul de energie. Pe arhitectura Blackwell, Nvidia a optimizat unitățile de calcul pentru a opera direct cu acest format, eliminând necesitatea conversiilor costisitoare.

Impactul asupra antrenării LLM-urilor

În pre-training-ul modelelor mari, cea mai mare piedică este adesea transferul de date între memorie și procesoare. Utilizând NVFP4, lățimea de bandă necesară se reduce la jumătate față de FP8, iar throughput-ul poate crește semnificativ – Nvidia raportează îmbunătățiri de până la 2x în anumite scenarii. Aceasta se traduce prin timpi de antrenare mai scurți și costuri mai mici pentru clusterele de GPU-uri.

Integrarea cu JAX și MaxText

Nvidia a colaborat cu Google pentru a include suportul NVFP4 în JAX, ecosystemul popular pentru cercetare în machine learning, și în MaxText, biblioteca optimizată pentru antrenarea LLM-urilor pe TPU-uri și GPU-uri. Dezvoltatorii pot activa NVFP4 cu o simplă opțiune de configurare, iar MaxText adaptează automat operațiile pentru a profita de noile capabilități Blackwell. Exemplele de cod și ghidurile sunt disponibile pe blogul Nvidia.

Concluzie practică

NVFP4 pe Blackwell nu este doar o noutate tehnică, ci un pas concret spre democratizarea antrenării LLM-urilor: mai rapid, mai eficient și mai accesibil. Pentru echipele de cercetare și inginerie care lucrează cu JAX și MaxText, actualizarea la noile drivere și librării poate aduce câștiguri imediate de performanță.

Tech Brief

Cele mai importante stiri tech, intr-un format scurt.

Primeste sinteza zilnica AI, cyber si gadgeturi direct in inbox.