4 Minute
Imaginează-ți o sală de servere plină de siliciu, fiecare cip lucrând la un munte de text. Aceasta este imaginea pe care echipa de cercetare a Huawei o promovează după ce a anunțat că a antrenat DeepSeek V4-Pro, un model cu 1,6 trilioane de parametri, folosind un cluster construit în jurul a cel puțin o mie de cipuri Ascend 910C.
Povestea sună simplu: siliciul AI produs local gestionează în sfârșit sarcini de antrenare la scară largă. Realitatea însă are mai multe straturi. Huawei afirmă că echipa a efectuat actualizări pe toți parametrii, adică fiecare greutate a modelului a fost antrenată și nu s-a limitat la adăugarea unui strat adaptor subțire, și că preantrenamentul pentru V4-Pro a procesat un corpus uluitor, raportat a depăși 32 de trilioane de tokeni. Preantrenamentul construiește capabilitățile de bază ale modelului; faza ulterioară de ajustare fină modelează comportamentul prin instruire și aliniere pentru siguranță.
De ce contează asta? Pentru că antrenamentul pe toți parametrii este mult mai solicitant decât tehnicile ușoare care ajustează doar o mică parte a rețelei. Cere debit susținut, interconexiuni stabile și orchestrare strânsă între cipuri. Istoric, grupurile chineze s-au confruntat cu dificultăți în a migra sarcini grele de antrenament de pe hardware-ul Nvidia fără a întâmpina blocaje în performanță și stabilitatea conexiunilor.
Huawei indică arhitectura cu design dual a Ascend 910C ca un punct de cotitură. Teste independente din experimentele anterioare DeepSeek sugerau că un cip Ascend putea oferi aproximativ 60% din performanța de inferență a Nvidia H100, dar acelea erau teste de inferență, nu de antrenament sincronizat la scară largă. Sarcinile de antrenament scot la iveală slăbiciuni diferite: comunicația colectivă, gestionarea memoriei și maturitatea software-ului devin decisive.

Cu toate acestea, afirmația are mențiuni. Cercetătorii au raportat finalizarea antrenamentului pe toți parametrii, dar nu au furnizat benchmark-uri riguroase: nici timp de rulare, nici metrici de throughput, nici comparații directe cu clustere H100, și nici o defalcare detaliată a consumului sau eficienței. Fără aceste cifre, anunțul sună exact ca ceea ce este, un reper tehnic încurajator, dar încă nu o dovadă independentă că clusterele Ascend egalează sau depășesc alternativele consacrate pentru preantrenamentul de vârf.
Există precedente pentru prudență. Rapoarte anterioare spuneau că încercările de a antrena un model diferit, R2, pe siliciul Huawei s-au lovit de instabilitate și interconexiuni lente între cipuri. Trecerea de la demonstrații reușite de inferență la preantrenament fiabil la scară largă este un salt major. Uneori companiile pot asambla suficientă inginerie pentru a finaliza o singură rulare, deși le lipsește robustețea necesară pentru dezvoltarea obișnuită a modelelor la scară.
Care este concluzia pentru ecosistemul AI mai larg? Dacă relatarea Huawei rezistă verificării, semnalează o competitivitate în creștere a hardware-ului AI chinez și un stack software în maturizare, capabil să orchestreze joburi de antrenament pe mii de cipuri. Dacă nu, subliniază că entuziasmul încă depășește progresul verificabil. Oricum, pasul următor este clar: benchmark-uri independente și date de rulare transparente.
Vom urmări acele cifre. Verificarea independentă ne va arăta dacă acesta este un adevărat punct de cotitură în infrastructura AI globală sau doar o dovadă de concept ambițioasă.
Sursa: smarti
Lasă un Comentariu