DeepSeek-V4: V4 Pro și V4 Flash cu context de 1M tokeni

3 Minutes

DeepSeek a ridicat cortina asupra DeepSeek-V4 Preview, iar cifrele sunt greu de ignorat. Compania chineză de inteligență artificială oferă acum două modele noi, V4 Pro și V4 Flash, ambele concepute pentru ferestre de context de un milion de tokeni, un reper care pune în centrul atenției gestionarea documentelor lungi, analiza de cod și raționamentul complex.

Modelele sunt deja disponibile pe site-ul DeepSeek în Modul Instant și Modul Expert, iar API-ul a fost actualizat și este activ azi. Pe o piață în care lungimea contextului a devenit unul dintre cele mai aprige câmpuri de luptă în domeniul inteligenței artificiale, DeepSeek face o mutare directă: oferă capacități serioase fără preț premium.

Două modele, o promisiune uriașă

Pe hârtie, diferența dintre cele două variante este izbitoare. DeepSeek-V4 Pro are 1,6 trilioane de parametri în total, dintre care 49 de miliarde sunt parametri activi, în timp ce V4 Flash este mai suplu, cu 284 de miliarde de parametri total și 13 miliarde de parametri activi. Ambele suportă aceeași lungime masivă de context de 1M, dar sunt clar adresate unor utilizatori și bugete diferite.

DeepSeek susține că modelul Pro este greul familiei. Este proiectat cu capacități agentive mai puternice, cunoștințe despre lume mai extinse și raționament avansat, pe care compania susține că le depășesc pe cele ale modelelor deschise actuale în matematică, domenii STEM și programare. DeepSeek adaugă însă o mențiune de precauție, afirmând că încă rămâne în urma Gemini 3.1 Pro în anumite domenii.

Flash, între timp, reprezintă oferta cu cel mai bun raport calitate-preț. DeepSeek îl descrie ca oferind un raționament care se apropie de cel al lui Pro, în timp ce se aliniază cu Pro la sarcini agentive mai simple. Adevărata atracție o reprezintă costul. Flash este poziționat ca opțiunea mai accesibilă pentru dezvoltatorii care doresc inteligență artificială cu context lung fără a le epuiza bugetul.

Structura de prețuri reflectă această strategie. Pentru Flash, costurile de intrare încep de la 0,028 USD la o potrivire în cache și 0,14 USD la o nepotrivire în cache, iar ieșirea este taxată la 0,28 USD. Pro este mult mai scump, cu costuri de intrare de 0,145 USD sau 1,74 USD în funcție de starea cache-ului, iar ieșirea este taxată la 3,48 USD.

Pentru utilizatorii care vor să încerce modelele imediat, DeepSeek a deschis accesul la chat.deepseek.com. Compania mai spune că greutățile deschise sunt disponibile, împreună cu un raport tehnic pentru oricine dorește să aprofundeze arhitectura, testele de referință și detalii despre antrenament.

Este o lansare îndrăzneață, care împinge din nou înainte discuția despre contextul lung. DeepSeek nu urmărește doar cifrele din titluri. Încearcă să demonstreze că modelele masive de inteligență artificială pot rămâne practice, accesibile și la prețuri rezonabile.

Comments

No comments yet.

DeepSeek-V4: V4 Pro și V4 Flash cu context de 1M tokeni

DeepSeek anunță DeepSeek-V4 Preview cu V4 Pro și V4 Flash, ambele cu ferestre de context de 1M tokeni. Modelele se concentrează pe documente lungi, analiza de cod și raționament complex, la costuri competitive.

Două modele, o promisiune uriașă

Leave a Comment

Comments

Related Posts

Impactul apariției AGI într-un an: provocări și pregătire

Canberra impune reguli pentru AI: apă, mediu și creatori

DeepSik V4 Pro: un competitor puternic în codare AI

Notificări pentru părinți despre conturile ChatGPT

Alibaba prezintă Qwen3.8: model cu greutăți descărcabile

Japonia și NVIDIA: fabrică națională AI pentru industrie

SpaceXAI: antrenare inițială a unui model de 2 trilioane

SpaceX negociază capacitate de calcul IA pentru Pentagon

Furia online devine pericol fizic pentru liderii IA

Întârziere Gemini 3.5 Pro afectează acțiunile Alphabet

Nvidia lansează Cosmos 3 Edge pentru conștiență spațială

NVIDIA Jetson Thor: compacte pentru robotică la margine