Please enable Javascript
Ir al contenido principal
De píxels a percepció: com l'etiquetatge escalable de fusió de sensors 3D impulsa la pròxima onada d'IA física
October 29, 2025

Les dades darrere de la intel·ligència física

Cada robot que navega per una fàbrica, cada vehicle autònom que detecta un vianant i cada dron que aterra sobre un objectiu en moviment depèn d’una cosa: dades etiquetades d’alta qualitat. Tanmateix, a mesura que la IA física esdevé més complexa, també ho fa la seva cadena de dades. La robòtica i els sistemes autònoms han d’interpretar les entrades de càmeres, lidars, radars, IMUs i sensors GPS — sovint en temps real. Aquí és on l’etiquetatge de fusió de sensors 3D esdevé fonamental per a la missió.

El reto de la percepción en los sistemas de IA física

Els sistemes físics d’IA moderns depenen de la percepció multimodal: veure, captar i entendre el seu entorn. Però les dades en brut que capten són desordenades:

  • Núvols de punts Lidar amb milions de punts per fotograma.
  • Retorns de radar que capten profunditat i velocitat però no la forma.
  • Fluxos de vídeo de càmeres RGB o d’infraroig.
  • Senyal d’inercials i GPS que requereixen alineació temporal.

Unificar aquests fluxos en un únic conjunt de dades requereix una pipeline de fusió i una plantilla que entengui la geometria 3D, els sistemes de coordenades i la calibració dels sensors. L’etiquetatge tradicional de caixes delimitadores 2D simplement no és suficient.

Per què l’etiquetatge de dades 3D és tan complex — i tan costós

L'etiquetatge de dades 3D requereix eines especialitzades i experiència:

  • Les caixes delimitadores 3D i la segmentació semàntica han d'alinear-se amb precisió amb les matrius de calibratge dels sensors.
  • La sincronització temporal entre diversos sensors garanteix que els fotogrames representin el mateix instant.
  • La gestió de l'oclusió i el seguiment multi-fotograma determinen si un objecte torna a aparèixer o surt de la vista.
  • La consistència de l'anotació i l'acord entre anotadors (IAA) afecten directament el rendiment del model.

A causa d'aquests reptes, moltes empreses es troben amb colls d'ampolla en l'entrenament de models de percepció: capacitat limitada, baixa qualitat i llargs terminis de lliurament. Per això recorren a socis d'àmbit empresarial que poden oferir canals d'anotació escalables i auditables.

Etiquetatge de la fusió de sensors: el futur de l'anotació de dades en robòtica

L'etiquetatge per fusió de sensors combina dades de múltiples modalitats (lidar, radar, vídeo) per crear una representació més rica del món físic. Per a la robòtica i els vehicles autònoms, això significa :

  • Major precisió en la detecció d'objectes en condicions de poca llum o meteorologia adversa. Millora en l'estimació de la profunditat i la velocitat.
  • Una comprensió de l'entorn més robusta gràcies a la validació creuada de les dades dels sensors.
  • Menys punts cecs i menys errors en casos límit.

Uber AI Solutions porta deu anys perfeccionant aquest procés a la seva pròpia plataforma de mobilitat i en programes associats arreu del món.

Conclusió: de les dades en brut a la percepció del món real

La IA física només és tan bona com les dades que l’ensenyen a veure i actuar. Mitjançant la fusió de tecnologia avançada d’etiquetatge de sensors amb una xarxa humana global i marcs de qualitat rigorosos, Uber AI Solutions permet a les empreses construir robots, vehicles i màquines fiables que operen de manera segura en el món real.