5 Minute
Xiaomi a intrat cu hotărâre în cursa pentru conducere autonomă. Noua sa platformă OneVL, lansată recent, este acum disponibilă ca cod sursă deschisă, iar propunerea este ambițioasă: să ofere sistemelor autonome o metodă mai bună de a citi drumul, de a raționa în fața incertitudinii și de a anticipa ce se întâmplă în continuare.
Acest lucru contează pentru că inteligența artificială pentru conducere autonomă a fost mult timp divizată între două școli de gândire. Pe de o parte se află modelele Viziune-Limbaj-Acțiune (VLA), care interpretează scenele de trafic și transformă acea înțelegere în decizii de conducere. Cealaltă se bazează pe modele ale lumii, proiectate să simuleze cum s-ar putea desfășura o situație în următoarele câteva secunde. Xiaomi afirmă că OneVL reunește aceste două direcții într-un singur cadru prin raționare în spațiul latent, o metodă menită să facă predicția și luarea deciziilor mai rapide și mai eficiente.
Pe scurt, compania încearcă să rezolve una dintre cele mai dificile probleme din tehnologia vehiculelor autonome: nu doar să vadă drumul, ci să înțeleagă relațiile de cauză și efect în timp real. Un pieton coboară de pe trotuar. Un scuter traversează o bandă. O mașină din față ezită la o intersecție. Acestea nu sunt imagini statice. Sunt puzzle-uri în mișcare. Xiaomi susține că OneVL este construit pentru a gestiona această complexitate cu o precizie mai mare decât abordările convenționale.
Compania afirmă că cadrul extinde capacitățile de raționament ale modelului său XLA, crescând în același timp atât viteza de inferență, cât și acuratețea. De asemenea, revendică rezultate solide la benchmark-uri uzuale legate de percepție, raționament și planificare, trei domenii esențiale pentru software-ul vehiculelor autonome. Xiaomi merge mai departe, susținând că OneVL poate depăși în acuratețe raționamentul explicit de tip lanțul gândirii, păstrând viteze apropiate de sistemele de inferență latentă optimizate în principal pentru predicția rezultatului final.
Nu doar mai rapid, ci și mai ușor de încredere
Unul dintre cele mai interesante aspecte ale anunțului este accentul Xiaomi pus pe interpretabilitate. În conducerea autonomă, cifrele de performanță sunt doar o parte a poveștii. Inginerii, reglementatorii și, în cele din urmă, pasagerii vor să știe de ce o mașină a luat o decizie. Xiaomi spune că OneVL își poate explica acțiunile atât în limbaj natural, cât și vizual, oferind practic dezvoltatorilor o fereastră mai clară asupra modului în care modelul a ajuns la o concluzie și ce se așteaptă să se întâmple în continuare pe drum.
Aceasta poate fi utilă mult dincolo de demonstrațiile de cercetare. Dacă un sistem poate arăta de ce a ales să frâneze, să schimbe banda sau să cedeze prioritatea, devine mai ușor de auditat, rafinat și, eventual, de validat în medii critice pentru siguranță. Pentru o industrie adesea criticată pentru luarea deciziilor în regim de cutie neagră, asta nu este un detaliu minor.
Momentul este, de asemenea, semnificativ. OneVL apare la scurt timp după ce Xiaomi a publicat în cod sursă deschisă Omnivoice, modelul său de generare audio, ceea ce sugerează că compania se implică mai puternic în dezvoltarea AI deschisă pe mai multe domenii. Nu este doar vorba de a publica cod din bunăvoință. Este un semnal. Xiaomi vrea o voce mai puternică în discuția despre inteligența artificială și vede clar mobilitatea inteligentă ca unul dintre câmpurile de luptă pe care merită să le revendice.
Concurența în domeniul conducerii autonome și al AI încarnate se înăsprește cu fiecare lună. Giganți tehnologici, constructori auto și startup-uri specializate urmăresc același premiu: sisteme care pot înțelege lumea fizică suficient de bine pentru a acționa în siguranță în interiorul ei. Prin publicarea în cod sursă deschisă a OneVL, Xiaomi nu se alătură pur și simplu concursului. Încearcă să modeleze regulile jocului.
Lasă un Comentariu