NVIDIA zakrpio kritične i visoke ranjivosti u AI alatima i infrastrukturi
NVIDIA je 24. marta 2026. objavila više bezbednosnih biltena za Apex, Triton Inference Server, NeMo Framework, Megatron LM, Model Optimizer, SNAP-4 i B300 MCU. Najozbiljniji propust je u Apex biblioteci, gde deserializacija nepouzdanih podataka u okruženjima sa PyTorch verzijama starijim od 2.6 može da dovede do izvršavanja koda, uskraćivanja usluge i drugih posledica. Dodatne visoke ranjivosti pogađaju NeMo, Megatron LM i Model Optimizer kroz checkpoint loading, ONNX quantization i slične mehanizme, dok Triton bilten opisuje više scenarija za rušenje servisa.
Ovo je važno za firme i timove koji koriste NVIDIA AI stack u razvoju, treniranju ili serviranju modela, jer problem nije samo u infrastrukturi nego i u framework-ovima i alatima oko modela. Posebno su rizična okruženja u kojima se učitavaju checkpoint fajlovi, modeli ili drugi ulazi iz spoljnog izvora, jer upravo tu više biltena opisuje mogućnost izvršavanja koda ili rušenja servisa.
- Popisati gde se u okruženju koriste Apex, Triton, NeMo, Megatron LM i Model Optimizer
- Ažurirati Apex na commit db8e053 ili noviji i koristiti PyTorch 2.6 ili noviji gde je primenljivo
- Ažurirati Triton Inference Server na 26.01, NeMo na 2.6.2, Megatron LM na 0.15.3 i Model Optimizer na 0.41.0 ili novije verzije
- Ograničiti učitavanje checkpoint, ONNX i drugih ulaznih fajlova samo na proverene izvore
- Pregledati AI pipeline-ove i inference servise koji su izloženi mreži i proveriti logove za padove, neobične zahteve i neuspešna učitavanja