Explicación sobre el entrenamiento de vehículos autónomos y el Motor de datos de Tesla

La idea de aprender a conducir puede llevarlo de regreso a sus días de adolescente detrás del volante con sus padres en el asiento del pasajero. Pero para los ingenieros de vehículos autónomos, aprender a conducir significa sumergirse en conjuntos de datos masivos, crear algoritmos de redes neuronales complejas y realizar mejoras incrementales durante años.

En el entrenamiento de vehículos autónomos, grandes equipos de ingenieros expertos en hardware y software utilizan datos, sistemas de simulación e infraestructuras de entrenamiento de inteligencia artificial (IA) de última generación a fin de preparar los vehículos autónomos para la carretera.

Como líder en el espacio de los vehículos autónomos, Tesla ha desarrollado una compleja infraestructura de aprendizaje automático para entrenar iterativamente sus computadoras de conducción autónoma total (FSD) para superar los desafíos del mundo real y, al mismo tiempo, mejorar los conjuntos de datos de entrenamiento de Tesla.

Aquí, examinaremos los conceptos fundamentales del flujo de trabajo del "Motor de datos" de Tesla para ver cómo los datos generados por los autos Tesla se usan retroactivamente para volver a entrenar esos mismos autos en el futuro.

¿Qué es el Motor de datos de Tesla?

Es el pilar fundamental en la carrera hacia la plena autonomía. Este flujo de trabajo de datos único emplea ejemplos de conducción del mundo real para ejecutar iterativamente los algoritmos de aprendizaje automático, que luego se utilizan para entrenar redes neuronales de conducción autónoma.

Tesla hace esto de manera excepcional: cada automóvil está equipado con una computadora FSD que ejecuta dos sistemas FSD en tándem. Una computadora FSD se emplea para conducir el vehículo y manejarlo cuando el piloto automático está activado, mientras que la otra computadora FSD se ejecuta constantemente en "modo de sombra".

Este modo de sombra funciona como si realmente estuviera controlando el automóvil. Aún así, cuando el conductor hace algo diferente de lo que hubiera hecho, o la red neuronal señala que no sabe qué hacer en el escenario presentado, ese evento se indica como una inexactitud. A medida que Tesla registra estas imprecisiones en su memoria, puede recopilarlas de forma retroactiva.

Supongamos que Tesla detecta suficientes imprecisiones en circunstancias similares. En ese caso, la empresa puede buscar condiciones de manejo similares que se encuentran en otros autos de la flota de Tesla, incluso si no detectó una inexactitud.

Luego, Tesla puede recopilar ejemplos contextuales similares. Al utilizar este conjunto de datos recién formado y bien etiquetado, Tesla puede volver a entrenar su red neuronal para reaccionar mejor a la situación en la que se presentaron esas imprecisiones. Una vez que la red neuronal se vuelve a entrenar, se puede implementar la red neuronal autónoma recién revisada en "modo de sombra" y recopilar nuevos ejemplos de datos para detectar más inexactitudes.

Recopilación de datos de Tesla a alto nivel

La representación visual en la imagen a continuación ilustra la naturaleza cíclica de la estrategia de recopilación e iteración de datos de Tesla. Primero, los datos se recopilan en la fuente (la computadora FSD en el Tesla). A continuación, el vehículo identifica una inexactitud. Esa inexactitud ingresa a las pruebas de unidades de Tesla para verificar su legitimidad y que no sea el resultado de una conducción deficiente por parte del conductor humano.

Si la inexactitud se considera legítima, Tesla le pide a su flota más ejemplos de dónde se encuentran esas inexactitudes. Luego, esos ejemplos son etiquetados correctamente por un humano y se utilizan para entrenar la red neuronal. Luego, la red se vuelve a implementar en la fuente de datos para recopilar más imprecisiones.

Competencia en la industria automotriz

Cuando la empresa presentó por primera vez su "Motor de datos" durante el evento Tesla Autonomy Day en 2019, naturalmente generó envidia en el resto de la industria automotriz

En un diálogo con Reuters en 2020, el CEO de Audi declaró: "Tesla está dos años por delante en términos de arquitectura informática y de software, y de conducción autónoma". Desde su inicio, esta infraestructura masiva de generación de datos, recopilación de material de entrenamiento, comprensión, iteración de reentrenamiento, implementación y mecanismo de repetición estuvo muy bien diseñada.

El "Motor de datos" presentaba integraciones compatibles en cada paso de la cadena de datos, lo que requería una arquitectura de recopilación, transferencia y cálculo de datos desde cero. Por ejemplo, los automóviles Tesla pueden admitir funcionalmente la conectividad inalámbrica a la base de datos central de Tesla y admitir la recopilación de datos y el procesamiento en modo de sombra, todo mientras se ejecutan los algoritmos para vehículos autónomos implementados en producción. En su presentación, ningún otro fabricante de automóviles tenía una infraestructura de recopilación de datos para vehículos autónomos tan sólida y madura como Tesla.

Ventajas en la iteración e identificación de casos

Una de las funciones más críticas del Motor de datos es su capacidad para detectar imprecisiones entre la conducción humana o las redes neuronales de producción, en comparación con su red neuronal desplegada en la sombra. En su presentación de Autonomy Day, Tesla usó el ejemplo de detectar imprecisiones en la conducción en presencia de bicicletas en la carretera para ilustrar la complejidad de su infraestructura de aprendizaje automático y su capacidad para identificar estas imprecisiones.

En sus redes neuronales de producción, Tesla consideró que las bicicletas debían evitarse por completo, dado que a menudo están ocupadas por humanos que las usan. Si un Tesla tuviera que chocar contra uno de dos objetos, chocaría contra otro automóvil en lugar de una bicicleta, ya que es probable que el automóvil proteja mejor a su conductor que la bicicleta.

Sin embargo, Tesla notó que, en algunos casos, las bicicletas estaban ubicadas en el medio de la carretera, muy cerca de otros autos, lo que activaba la red neuronal en la sombra para indicar que no sabía qué hacer en comparación con el comportamiento del conductor. De manera alternativa, Tesla pudo haber notado que cuando su red neuronal de piloto automático de producción estaba funcionando y se identificaba una bicicleta "en el medio de la carretera", los conductores humanos podrían haber intervenido para "corregir" el curso del automóvil.

Cuando se notificó a Tesla, los técnicos de etiquetado de datos auditaron la inexactitud y descubrieron que esto ocurría cuando los automóviles tenían instalados portabicicletas y llevaban bicicletas.

Para los humanos, este evento habría sido simplemente una novedad, pero estos datos de entrenamiento revelaron un desafío crítico para la red neuronal de producción en los automóviles autónomos. En esta situación, Tesla le pidió a su flota de vehículos habilitados para FSD que buscaran otros eventos que pudieran haber incluido una bicicleta en un automóvil o cerca de este.

Luego, estos ejemplos de datos se enviaron a los técnicos de etiquetado de datos que identificaron correctamente una bicicleta real, una bicicleta montada detrás de un automóvil, una bicicleta montada en la parte superior de un automóvil o ninguna de las anteriores. Al usar el conjunto de datos recién recopilados y etiquetados, la red neuronal en versión beta podría volver a entrenarse usando los centros de datos de aprendizaje automático de Tesla y volver a implementarse en toda la flota para ejecutarse en modo de sombra y repetirse.

Con su motor de datos, Tesla puede crear nuevas versiones de software utilizando los aprendizajes de sus implementaciones en modo de sombra y las iteraciones de entrenamiento rápido. La genialidad de la infraestructura de recopilación de datos de Tesla es que incluye ejemplos de datos de la vida real y utiliza a los conductores humanos para entrenar sus modelos de aprendizaje automático. En última instancia, el motor de datos de Tesla acelera el entrenamiento de redes neuronales mediante la recopilación rápida de datos de entrenamiento para coches autónomos bien etiquetados y de la vida real y, además, los utiliza de forma activa para realizar pruebas iterativas de aprendizaje automático.

La recopilación de datos de Tesla para alcanzar la victoria

Otras empresas del sector de vehículos autónomos tienen métodos patentados para entrenar sus coches, pero ninguna opera a la escala de Tesla. Con automóviles en todo el mundo, Tesla puede recopilar más datos de conducción segura y más inexactitudes de situaciones extremas, y usar esto para entrenar a sus redes neuronales.

Muchas otras empresas tienen simulaciones de entrenamiento y mecanismos de recopilación de datos extremadamente sólidos pero, a menudo, el alcance de su trabajo se limita a una sola ciudad o región. En cualquier caso, los datos generados por los coches autónomos (y en este punto, solo los vehículos semiautónomos) son la llave inevitable que abrirá completamente la puerta a los automóviles autónomos.


ArrowPerks-Loyalty-Program-Signup-banner-ES


Últimas noticias

Lo sentimos, pero su selección de filtros no devolvió resultados.

Hemos actualizado nuestra política de privacidad. Por favor tome un momento para revisar estos cambios. Al hacer clic en Acepto, usted está de acuerdo con la Politica de Privacidad de Arrow Electronics y sus condiciones de uso.

Nuestro sitio Web coloca cookies en su dispositivo para mejorar su experiencia y nuestro sitio. Lea más sobre las cookies que utilizamos y cómo desactivarlas aquió. Es posible que se utilicen las cookies y tecnologías de seguimiento con fines de marketing.
Al hacer clic en "Aceptar", usted está consintiendo la colocación de cookies en su dispositivo y el uso de tecnologías de seguimiento. Haga clic en "Leer más" a continuación para obtener más información e instrucciones sobre cómo desactivar las cookies y tecnologías de seguimiento. Si bien la aceptación de cookies y tecnologías de seguimiento es voluntaria, la desactivación de estos puede resultar en que el sitio web no funcione correctamente, y es posible que ciertos anuncios sean menos relevantes para usted.
Respetamos su privacidad. Lea nuestra política de privacidad aquió