De C++ a Neuronas: Entendiendo la Revolución End-to-End

25 de enero de 2025 · 6 min de lectura

Equipo Editorial

El FSD de Tesla ha experimentado la transformación más radical de su historia. Con las versiones v12 y v13, Tesla ha abandonado cientos de miles de líneas de código escritas por humanos para sustituirlas por una red neuronal que aprende a conducir... mirando vídeos de conductores reales. Este es el cambio más importante en la historia de la conducción autónoma, y merece una explicación detallada.

El viejo mundo: código "if/then"

Hasta la versión 11 del FSD, el software de Tesla funcionaba con una arquitectura híbrida:

Redes neuronales para la percepción: Identificar objetos (coches, peatones, señales)
Código C++ para la decisión: Reglas escritas por humanos sobre qué hacer

Imagina que eres un ingeniero de Tesla y tienes que programar el comportamiento ante un stop:

if (detectSignal == STOP_SIGN) {
    slowDown();
    if (distanceToSign < 5m) {
        fullStop();
        waitSeconds(3);
        if (intersectionClear()) {
            proceed();
        }
    }
}

Parece sencillo, ¿verdad? Ahora imagina que tienes que escribir reglas para:

Un stop parcialmente oculto por un árbol
Un stop en una rotonda mal señalizada
Un policía haciendo señales que contradicen el stop
Un stop en una calle de un solo sentido con coches aparcados en doble fila

Cada situación requería más código, más reglas, más excepciones. El resultado: más de 300.000 líneas de código C++ intentando cubrir la infinita variabilidad del mundo real.

El problema fundamental

El mundo real no sigue reglas. Los humanos no conducimos con un manual de "if/then" en la cabeza. Conducimos con intuición, experiencia y adaptación constante.

El nuevo paradigma: Photon-to-Control

Con la v12, Tesla dio un salto conceptual radical. En lugar de programar reglas, entrenaron una red neuronal masiva con un objetivo simple:

Entrada: Fotones (vídeo de las 8 cámaras del coche) Salida: Controles (ángulo del volante, posición de pedales)

No hay reglas intermedias. No hay código que diga "si ves un stop, para". La red neuronal ha visto millones de veces a humanos parando en stops y ha aprendido el patrón.

¿Cómo aprende?

Tesla tiene la mayor flota de vehículos conectados del mundo. Cada Tesla con cámaras está potencialmente grabando cómo conducen sus propietarios. Este vídeo se usa para entrenar la red:

El humano conduce: El coche graba vídeo + acciones del conductor
La IA observa: La red neuronal procesa millones de horas de conducción
Aprende patrones: No reglas explícitas, sino comportamientos emergentes
Reproduce: Cuando ve una situación similar, replica lo que haría un humano

Es como enseñar a un niño a montar en bici mostrándole miles de vídeos, en lugar de darle un manual de física.

La eliminación de 300.000 líneas de código

El resultado más visible de este cambio fue dramático: Tesla eliminó más de 300.000 líneas de código humano del FSD. Todo ese trabajo de años de ingenieros programando reglas quedó obsoleto.

Aspecto	FSD v11 (Híbrido)	FSD v12/v13 (End-to-End)
Percepción	Red neuronal	Red neuronal
Planificación	Código C++	Red neuronal
Control	Código C++	Red neuronal
Líneas de código	~300.000+	Prácticamente cero
Actualización	Programadores escriben reglas	La red se re-entrena con datos

¿Por qué importa esto para Europa?

Aquí está el punto crucial para los lectores españoles: el sistema end-to-end necesita entrenamiento local.

Los conductores californianos conducen diferente a los madrileños. Las rotondas españolas no existen en Los Ángeles. La señalización vertical francesa es distinta a la americana. El "caos organizado" de una calle estrecha en el centro de Sevilla no tiene equivalente en las amplias avenidas de Phoenix.

La "Euro-Net"

Tesla está trabajando en lo que internamente se conoce como entrenamiento específico para Europa. Esto implica:

Recopilación de datos: Los Tesla europeos ya están enviando vídeos de conducción
Entrenamiento diferenciado: Redes neuronales específicas para comportamientos europeos
Validación local: Pruebas en condiciones reales (como las que vemos en Madrid)

Las pruebas del FSD en España no son solo para cumplir con la DGT. Son para enseñarle a la IA cómo se conduce aquí.

Las mejoras de la v13

La versión 13 del FSD representa una refinación significativa del paradigma end-to-end:

Simplificación del pipeline de datos

Ingenieros de Tesla han comparado la reescritura de la v13 con la evolución de los motores Raptor de SpaceX: una simplificación drástica que permite mayor velocidad y fiabilidad.

Park-to-Park

Una de las capacidades más impresionantes de la v13 es el Park-to-Park (P2P):

El coche sale de una plaza de aparcamiento
Navega hasta la vía pública
Conduce hasta el destino
Busca aparcamiento autónomamente
Aparca solo (incluyendo cambios de marcha D/R)

Conducción más "humana"

Los usuarios reportan que la v13 conduce de forma más natural:

"Creeping" en intersecciones: Avanza lentamente para ver mejor, como haría un humano
Negociación de espacios estrechos más fluida
Menos frenadas bruscas e innecesarias
Mejor comprensión del contexto social del tráfico

El reto de escalar globalmente

Aunque el paradigma end-to-end es revolucionario, presenta desafíos únicos para la expansión internacional:

Datos locales: Necesita millones de kilómetros de conducción local
Validación regulatoria: Cada país quiere ver pruebas en sus carreteras
Casos extremos: Las situaciones raras (obras, accidentes, condiciones climáticas) son difíciles de entrenar

Para Europa, esto significa que aunque la tecnología de base es la misma que funciona en EE.UU., el modelo específico europeo llevará tiempo de desarrollo y validación adicional.

Implicaciones para el propietario español

Si tienes un Tesla en España, esto es lo que significa el cambio a end-to-end:

Lo positivo

Cuando llegue, el comportamiento será más natural y fluido
El sistema mejorará constantemente con los datos de tu conducción
Las actualizaciones traerán mejoras reales, no solo parches

Lo menos positivo

El entrenamiento europeo va retrasado respecto al americano
Tu hardware (HW3 vs HW4) puede limitar la experiencia
No hay fecha concreta de llegada

Conclusión

El cambio de código C++ a redes neuronales end-to-end es el equivalente a pasar de calcular trayectorias de cohetes a mano a dejar que una IA las optimice. Es un salto fundamental en cómo pensamos sobre la conducción autónoma.

Para Europa, el reto ahora no es solo regulatorio (aunque lo es). Es también de datos: Tesla necesita que sus coches europeos "enseñen" a la IA cómo se conduce aquí. Las pruebas en Madrid son parte de ese proceso.

La buena noticia es que el paradigma end-to-end escala mejor que el código manual. Una vez que la red neuronal europea esté entrenada y validada, las mejoras vendrán más rápido que nunca. La mala noticia es que ese "una vez" sigue sin tener fecha.

¿Te interesa profundizar en los aspectos técnicos del FSD? ¿Quieres que expliquemos conceptos como backpropagation, transformers o aprendizaje por refuerzo? Déjanos saber en los comentarios.

El viejo mundo: código "if/then"​

El nuevo paradigma: Photon-to-Control​

¿Cómo aprende?​

La eliminación de 300.000 líneas de código​

¿Por qué importa esto para Europa?​

La "Euro-Net"​

Las mejoras de la v13​

Simplificación del pipeline de datos​

Park-to-Park​

Conducción más "humana"​

El reto de escalar globalmente​

Implicaciones para el propietario español​

Lo positivo​

Lo menos positivo​

Conclusión​