Los DATOS que impulsan la innovación y la valoración de Tesla

En el momento de escribir estas líneas, Tesla es el fabricante de automóviles más valioso del mundo por capitalización bursátil, superando a otros gigantes mundiales como Toyota, Volkswagen e incluso los "Tres Grandes" de Detroit. https://www.statista.com/chart/22043/market-capitalization-of-publicly-traded-car-manufacturers/    

¿Pero cómo?

En una entrevista concedida al periódico alemán Handelsblatt, el Consejero Delegado de Audi ha afirmado que Tesla va dos años por delante del sector tanto en software para coches como en capacidades autónomas. Pero estamos dispuestos a argumentar que están aún más por delante del resto de la industria del automóvil con respecto a los activos de datos y la experiencia, que es posiblemente el pilar más importante de las operaciones de Tesla. No podemos ofrecer un argumento convincente sobre la valoración de Tesla, pero podemos compartir nuestra perspectiva sobre su impresionante uso de los datos y algunas ventajas que les proporciona. 

 Pruebe y aprenda

Probar y aprender forma parte de la práctica habitual de los creadores de software, automóviles o prácticamente cualquier otra cosa. En la industria del automóvil, sin embargo, este ciclo de aprendizaje y despliegue se ha detenido en gran medida (al menos históricamente) en el momento en que las ruedas tocan el asfalto. Si bien es cierto que ha habido retiradas de seguridad y algunas unidades de control posventa para aumentar el rendimiento y la eficiencia, los fabricantes de vehículos solían optar por actualizaciones muy limitadas una vez que el coche salía del concesionario.

Tesla Inc., sin embargo, ha diseñado fundamentalmente su esfuerzo de fabricación y desarrollo de software para que se base en datos y sea iterativo, especialmente después de que el coche haya salido de la fábrica. Las actualizaciones y mejoras "en el aire" del software de Tesla han formado parte de la estrategia desde el principio. De hecho, existe el argumento de que la ventaja clave de Tesla es su recopilación de datos, pruebas, aprendizaje y mejoras DESPUÉS de estar en manos del propietario. 

¿Qué es el Tesla Data Engine?

Tesla tiene ahora más de 500.000 coches en la carretera. Aunque se trata de una fracción de los grandes fabricantes de automóviles, Tesla utiliza cada coche en la carretera para recopilar y analizar un río de datos. Cada Tesla reciente tiene 8 cámaras, 12 sensores ultrasónicos y un radar orientado hacia delante. Estas herramientas y otros sensores del coche graban constantemente vídeo y datos como la velocidad, la aceleración, el frenado y la información sobre la batería de cada kilómetro que recorren esos coches. TeslaCam, en modo Sentry, recopila vídeo incluso cuando el Tesla está aparcado. Muchos de estos datos están a disposición de Tesla como parte de sus condiciones de uso y pueden recopilarse de forma remota a través de la conexión del coche a Internet. 

A continuación, Tesla utiliza redes neuronales de aprendizaje automático para ayudar a comprender el rendimiento del vehículo y realizar pruebas beta para introducir mejoras. Por ejemplo, si tienes un Tesla y rara vez lo conduces en modo Piloto Automático, tu vehículo sigue simulando constantemente que está en Piloto Automático y notando las discrepancias entre tu conducción y la de la red neuronal. Tesla puede entonces transmitir las imprecisiones de su red neuronal a su equipo de investigación y utilizar los datos para volver a entrenar su red neuronal, desplegar versiones beta de la nueva prueba, recoger comentarios, iterar y mejorar.

Como ejemplo, consideremos el caso de una señal de stop oculta por el follaje. Tesla observará a los conductores que se detienen en esta intersección, creará un activador indicando que el piloto automático de Tesla puede haber pasado por alto que hay una señal de stop y transmitirá las imágenes observadas al equipo de ciencia de datos. Tesla dispone ahora de un excelente conjunto de imágenes para entrenar a su IA en la detección de señales de stop ocultas por el follaje. Con más coches en la carretera, generando datos e imágenes y situaciones únicas, Tesla aprende y mejora rápidamente. Tesla ya ha superado los 3.000 MILLONES de kilómetros recorridos con el piloto automático. Waymo u otros fabricantes de coches no pueden igualar los kilómetros reales recorridos de los más de 500.000 Tesla que generan nuevos datos en tiempo real cada día. 

Disponer de datos es una cosa, pero utilizarlos bien es otra: Elon Musk ha dicho: "En realidad es todo un reto procesar esos datos, y luego entrenar con ellos, y hacer que el vehículo aprenda eficazmente de los datos, porque es una cantidad ingente".

Fuente: Día de la Autonomía de Tesla 2019

Tesla ha creado una infraestructura y un equipo globales para garantizar que maximiza su aprendizaje a partir del vasto río de datos de Tesla. Lo llaman el "motor de datos" de Tesla. El motor de datos se muestra arriba y es un clásico efecto de "volante de inercia", donde más datos permiten una formación y mejora más rápidas, que luego vende más coches debido a las ventajas/mejoras generadas, lo que luego conduce a aún más datos e iteraciones más rápidas porque Tesla tiene más coches en la carretera recopilando datos.

Para reiterar - Andrej Karpathy, Director Senior de IA de Tesla, explica algunas de las principales características de su Motor de Datos durante su discurso durante el Día de la Autonomía de Tesla 2019:

"Disponemos de un mecanismo ML que nos permite pedir a la flota que nos proporcione ejemplos que se parezcan a [ejemplo X], y la flota podría responder con imágenes que contengan esos patrones... Nosotros entraríamos y anotaríamos esos [ejemplos] y el rendimiento de la flota identificando [ese ejemplo]. Buscamos muchas cosas, todo el tiempo, buscamos casos raros. Si podemos encontrarlos a gran escala, podemos anotarlos correctamente y la red neuronal aprenderá a tratarlos en el mundo real. Si detectamos que la red neuronal puede ser insegura, o detectamos que el conductor interviene, podemos crear esta infraestructura de activación que nos envíe datos sobre esas imprecisiones".

El motor de datos de Tesla es una ventaja única

La idea del motor de datos de Tesla es relativamente sencilla, pero difícil de reproducir. El flujo de datos de Tesla es amplio, continuo, estructurado y real, características esenciales para entrenar una red neuronal.

La ventaja de Tesla en materia de datos procede de toda la flota: la red mundial de conductores que prueban constantemente la programación de Tesla y los impresionantes científicos de datos que utilizan la potencia de cálculo en Palo Alto para reentrenar las redes neuronales del piloto automático y la conducción autónoma de Tesla. En última instancia, cuantos más coches haya en la carretera, mejor será toda su flota a la hora de conducir de forma segura y proteger a sus usuarios, y más cerca estarán de contar con un vehículo de conducción autónoma completo.

En nuestra opinión, Tesla no es simplemente una empresa automovilística: es una empresa de IA/ML que despliega coches por todo el mundo para recopilar datos. En última instancia, esos datos, la experiencia de Tesla en ciencia de datos y los conocimientos potenciales generados (tal vez incluso más allá de la industria del automóvil) pueden ser una parte de la explicación de su extraordinaria valoración. 

 

¿Listo para construir lo que realmente importa?

Hablemos