11 Minute
Producătorul chinez de GPU-uri Moore Threads a prezentat arhitectura sa de generație următoare, denumită Huagang ("Ghiveciul de flori"), în cadrul conferinței pentru dezvoltatori MUSA 2025, promițând creșteri semnificative atât pentru sarcini de gaming, cât și pentru aplicații AI. Compania a anunțat, de asemenea, două cipuri construite pe această arhitectură — Lushan pentru grafică și Huashan pentru calcul AI — cu lansări de produse planificate pentru 2026.
Două cipuri, două misiuni: Lushan pentru gameri, Huashan pentru AI
Huagang se concentrează pe un calcul mai dens și mai eficient: unități de calcul reproiectate pe care Moore Threads afirmă că măresc densitatea de calcul cu aproximativ 50% în timp ce îmbunătățesc eficiența energetică cu circa 10%. Arhitectura introduce un set de instrucțiuni nou, suport pentru programare asincronă și o planificare mai inteligentă a firelor (thread scheduling) — funcționalități optimizate pentru redare în timp real modernă și inferență AI la scară mare.
În termeni practici, aceste schimbări arhitecturale vizează obținerea unui raport performanță/watt mai bun, o latență mai mică în operații paralele și o compatibilitate mai bună cu sarcinile hibride care combină grafică și calcul AI. Arhitectura Huagang pare proiectată pentru a răspunde cerințelor tot mai ridicate ale aplicațiilor moderne: ray tracing avansat, geometrie complexă în scene mari și inferență pe modele de limbaj și viziune computerizată.
Lushan: nouă generație pentru gaming și creație
Lushan înlocuiește cardurile anterioare MTT S80 și S90 și este poziționat atât pentru gameri, cât și pentru profesioniști. Moore Threads revendică câștiguri ample: până la 15× performanță mai bună în titluri AAA selectate, 50× mai bun în ray tracing pentru anumite sarcini și 64× mai multă performanță AI în unele fluxuri de lucru. Astfel de cifre sunt impresionante, dar necesită o analiză atentă a metodelor și scenariilor de test pentru a înțelege domeniul lor de aplicabilitate.
Compania subliniază de asemenea îmbunătățiri majore în procesarea de geometrie și în ratele de umplere a texturilor, precum și o creștere a memoriei locale de la 16GB la până la 64GB — un salt concret pentru gestionarea scenelor foarte mari, a proiectelor CAD/CAE și a fluxurilor de lucru de creare de conținut. Memoria mai mare locală reduce frecvența accesului la memorie externă și poate susține texturi la rezoluții mai mari, cache-uri GPU mai eficiente și mai puțină paginare, aspecte esențiale pentru profesioniști și prosumatori.
Lushan introduce, de asemenea, arhitectura de redare unificată UniTE și un bloc AI dedicat pentru accelerarea sarcinilor mixte grafică/AI. UniTE pare să fie concepută pentru a consolida pipeline-urile tradiționale de rendering și pentru a facilita integrarea operațiilor AI (de exemplu, denoising accelerat de rețele neuronale, upscaling bazat pe ML) direct pe GPU, fără a necesita transferuri costisitoare între subsisteme. Pentru dezvoltatori și creatori de conținut, aceasta poate însemna performanțe mai bune în ray tracing în timp real, frame pacing îmbunătățit și instrumente mai eficiente pentru post-procesare bazată pe ML.
Performanță în gaming și compatibilitate
Pe partea de gaming, promisiunile Lushan vizează atât creșteri raw de frame-rate, cât și îmbunătățiri calitative (ray tracing, umbre, iluminare globală). Importanța driverelor, optimizărilor specifice pentru motorul grafic (Unity, Unreal Engine) și compatibilitatea cu API-uri precum DirectX 12 Ultimate și Vulkan rămân critice pentru traducerea acestor specificații în experiențe reale. Moore Threads va trebui să ofere kituri de dezvoltare, biblioteci și parteneriate cu studiouri și dezvoltatori pentru a susține afirmațiile privind îmbunătățirile în titluri AAA.
Aplicații profesionale și CAD/CAE
Pentru aplicații profesionale — proiectare asistată de calculator, modelare 3D sau simulări — memoria mai mare și îmbunătățirile de throughput la geometrie pot accelera fluxurile de lucru pentru scene mari, seturi dense de modele și vizualizări complexe. Saltul la 64GB de memorie GPU face Lushan mai relevant pentru utilizatorii care lucrează cu dataseturi voluminoase sau cu sesiuni de randare distribuită pe stații de lucru.

Huashan: orientat spre calculul masiv AI
Contrar Lushan, Huashan este construit pentru calcul AI intensiv. Folosește o arhitectură cu două chiplet-uri (dual-chiplet) asociată cu nouă module HBM și suport pentru formatele numerice FP4 și FP64. Utilizarea HBM oferă lățime de bandă foarte mare pentru accesul la date, în timp ce suportul pentru FP4 indică o optimizare pentru inferență la scară mare (unde precizia redusă poate fi suficientă), iar suportul pentru FP64 sugerează și capabilități pentru calcule de înaltă precizie, utile în anumite sarcini științifice sau de cercetare.
Moore Threads a făcut comparații directe între Huashan și familiile NVIDIA Hopper și Blackwell, susținând o performanță în virgule mobile apropiată de Blackwell B200 și o lățime totală de bandă comparabilă, cu caracteristici de acces la memorie deosebit de puternice. Aceste afirmații, dacă se verifică, ar poziționa Huashan drept un concurent credibil în segmentul acceleratoarelor AI pentru inferență și potențial pentru anumite tipuri de antrenare distribuită. Totuși, comparațiile cu arhitecturi bine stabilite precum Hopper/Blackwell necesită benchmarkuri independente și condiții de testare identice pentru o evaluare corectă.
Arhitectura chiplet și memorie HBM
Designul chiplet permite scalabilitate și eficiență de producție: multe companii adoptă această abordare pentru a combina die-uri specializate și a îmbunătăți randamentul în fabricație. Configurația cu nouă module HBM oferă throughput de memorie foarte mare, esențial pentru modele AI cu footprint mare de memorie și pentru operații TPU/accelerator care sunt legate de bandă. Integrarea FP4 este utilă pentru inferență la scară, unde reducerea precisiei duce adesea la creșteri importante ale performanței și la scăderi ale consumului de energie.
Scalabilitate prin MTLink 4.0
Moore Threads afirmă că Huashan poate scala pe multe dispozitive folosind MTLink 4.0, cu o viteză de interconectare citată de 1.314 GB/s și o scalabilitate teoretică la peste 100.000 de unități. Un interconnect cu latență scăzută și lățime de bandă mare este crucial pentru antrenarea distribuită a modelelor mari și pentru inferența colaborativă în clustere AI. Dacă MTLink 4.0 oferă coerență de memorie eficientă și sincronizare performantă între dispozitive, Huashan ar putea fi atractiv pentru centre de date AI și pentru implementări la scară enterprise.
Verificare independentă și scenarii de test
Toate cifrele menționate sunt revendicări ale companiei, iar benchmark-urile independente vor fi necesare pentru a valida performanța reală în raport cu competitorii. În evaluări, este important să se ia în calcul:
- Metodologia benchmark-urilor și reproducibilitatea testelor;
- Profilurile de consum energetic (Watt) și raportul performanță/watt;
- Comportamentul în workload-uri mixte (grafică + AI) și latența în inferență;
- Compatibilitatea cu biblioteci AI (TensorFlow, PyTorch) și instrumentele de profiling;
- Driveri, SDK-uri și suport pentru API-uri (DirectX, Vulkan, CUDA-equivalent sau interoperabilitate).
O comparație corectă cu produse precum NVIDIA Blackwell sau AMD-ul echivalent trebuie să țină cont de versiunea software, optimizările la nivel de kernel, și de scenariile exacte de utilizare (antrenare vs inferență, throughput vs latență, single-node vs multi-node).
Implicații pentru piață și pentru ecosistem
Impact în gaming și pe piața prosumer
Dacă Lushan oferă în mod constant performanța revendicată, memoria locală mai mare și capabilitățile de ray tracing îmbunătățite ar putea face GPU-urile Moore Threads mult mai atractive pentru prosumatori și creatori de conținut care caută soluții cu memorie generoasă la costuri competitive. Totuși, adoptarea la scară largă în gaming depinde de driveri stabili, optimizări OEM și parteneriate cu producători de sisteme și dezvoltatori de jocuri.
Adopție în centre de date și clustere AI
Huashan, prin designul chiplet și MTLink 4.0, pare orientat către implementări la scară mare. Atragerea interesului operatorilor de centre de date va depinde de ecosistemul software, eficiența energetică și costul total de operare (TCO). Suportul pentru formate numerice variate (FP4, FP64) și un stack software compatibil cu PyTorch/TensorFlow, împreună cu drivere și biblioteci pentru comunicații distribuite, sunt elemente cheie pentru integrare.
Ecosistem software și suport pentru dezvoltatori
Succesul tehnologiilor GPU noi nu mai este doar o chestiune de hardware: ecosistemul software și experiența dezvoltatorilor sunt esențiale. Moore Threads va trebui să ofere SDK-uri robuste, instrumente de profiling, drivere optimizate și compatibilitate cu standardele existente. De asemenea, parteneriatele cu furnizorii de middleware, dezvoltatori de motoare grafice și firme de AI sunt cruciale pentru adoptare.
Analiză competitivă și perspective
Moore Threads intră pe o piață dominată de jucători mari precum NVIDIA și AMD, dar faptul că oferă opțiuni distincte pentru grafică (Lushan) și AI (Huashan), cu un accent special pe memorie locală și scalabilitate, arată o strategie clară de diferențiere. Punctele forte anunțate — memorie mare, arhitectură unificată de redare, bloc AI dedicat și interconectare scalabilă — sunt elemente care pot închide unele dintre decalajele față de competitori, în special dacă prețul și disponibilitatea vor fi competitive.
Riscurile rămân legate de maturitatea software-ului, optimizările pentru titluri și modele populare, precum și de încrederea pieței în suportul pe termen lung. De asemenea, comparațiile de performanță cu arhitecturi consacrate trebuie privite cu prudență până la apariția benchmark-urilor independente și a testelor în condiții reale de utilizare.
Concluzii și perspective de lansare
Moore Threads marchează o etapă ambițioasă prin Huagang, Lushan și Huashan. Dintre promisiunile cheie reies direcții clare: creșterea densității de calcul, eficiența energetică, memorie locală extinsă, și scalabilitate în mediile AI. Dacă aceste caracteristici vor fi susținute de un ecosistem software robust și de benchmark-uri independente favorabile, GPU-urile bazate pe Huagang ar putea deveni alternative viabile pe piețele de gaming, creație de conținut și centre de date AI.
Rămâne de văzut dacă memoria locală mai mare și performanțele ray tracing vor atrage prosumatori și cadre profesionale către Lushan și dacă arhitectura chiplet și MTLink 4.0 vor câștiga tracțiune în clusterele AI pentru Huashan. Primele plăci de consum bazate pe Lushan sunt așteptate în 2026, iar produsele bazate pe Huashan ar trebui să apară aproximativ în aceeași perioadă. Până atunci, comunitatea tehnică și analiștii vor aștepta benchmark-uri independente, teste de compatibilitate software și primele recenzii din teren.
Pe măsură ce Moore Threads își pousse pașii pe piața globală a GPU-urilor, observatorii industriei vor urmări nu doar cifrele de performanță, ci și capacitatea companiei de a construi parteneriate, un ecosistem de dezvoltare robust și un lanț de aprovizionare stabil — toate esențiale pentru succes pe termen lung în segmentele competitive ale graficii și AI-ului.
Sursa: gizmochina
Lasă un Comentariu