DeepSeek-V4: V4 Pro și V4 Flash cu context de 1M tokeni

DeepSeek-V4: V4 Pro și V4 Flash cu context de 1M tokeni

Comentarii

3 Minute

DeepSeek a ridicat cortina asupra DeepSeek-V4 Preview, iar cifrele sunt greu de ignorat. Compania chineză de inteligență artificială oferă acum două modele noi, V4 Pro și V4 Flash, ambele concepute pentru ferestre de context de un milion de tokeni, un reper care pune în centrul atenției gestionarea documentelor lungi, analiza de cod și raționamentul complex.

Modelele sunt deja disponibile pe site-ul DeepSeek în Modul Instant și Modul Expert, iar API-ul a fost actualizat și este activ azi. Pe o piață în care lungimea contextului a devenit unul dintre cele mai aprige câmpuri de luptă în domeniul inteligenței artificiale, DeepSeek face o mutare directă: oferă capacități serioase fără preț premium.

Două modele, o promisiune uriașă

Pe hârtie, diferența dintre cele două variante este izbitoare. DeepSeek-V4 Pro are 1,6 trilioane de parametri în total, dintre care 49 de miliarde sunt parametri activi, în timp ce V4 Flash este mai suplu, cu 284 de miliarde de parametri total și 13 miliarde de parametri activi. Ambele suportă aceeași lungime masivă de context de 1M, dar sunt clar adresate unor utilizatori și bugete diferite.

DeepSeek susține că modelul Pro este greul familiei. Este proiectat cu capacități agentive mai puternice, cunoștințe despre lume mai extinse și raționament avansat, pe care compania susține că le depășesc pe cele ale modelelor deschise actuale în matematică, domenii STEM și programare. DeepSeek adaugă însă o mențiune de precauție, afirmând că încă rămâne în urma Gemini 3.1 Pro în anumite domenii.

Flash, între timp, reprezintă oferta cu cel mai bun raport calitate-preț. DeepSeek îl descrie ca oferind un raționament care se apropie de cel al lui Pro, în timp ce se aliniază cu Pro la sarcini agentive mai simple. Adevărata atracție o reprezintă costul. Flash este poziționat ca opțiunea mai accesibilă pentru dezvoltatorii care doresc inteligență artificială cu context lung fără a le epuiza bugetul.

Structura de prețuri reflectă această strategie. Pentru Flash, costurile de intrare încep de la 0,028 USD la o potrivire în cache și 0,14 USD la o nepotrivire în cache, iar ieșirea este taxată la 0,28 USD. Pro este mult mai scump, cu costuri de intrare de 0,145 USD sau 1,74 USD în funcție de starea cache-ului, iar ieșirea este taxată la 3,48 USD.

Pentru utilizatorii care vor să încerce modelele imediat, DeepSeek a deschis accesul la chat.deepseek.com. Compania mai spune că greutățile deschise sunt disponibile, împreună cu un raport tehnic pentru oricine dorește să aprofundeze arhitectura, testele de referință și detalii despre antrenament.

Este o lansare îndrăzneață, care împinge din nou înainte discuția despre contextul lung. DeepSeek nu urmărește doar cifrele din titluri. Încearcă să demonstreze că modelele masive de inteligență artificială pot rămâne practice, accesibile și la prețuri rezonabile.

Lasă un Comentariu

Comentarii