車の運転を学ぶという考えは、両親を助手席に座らせて車を運転していた十代の頃を思い出すかもしれません。しかし、自動運転車のエンジニアにとって、運転を学ぶということは、膨大なデータセットを詳しく調べ、 複雑なニューラルネットワークアルゴリズムを作成し、 何年にもわたって段階的に改善を重ねることを意味します。
自動運転車のトレーニングでは、専門のハードウェア エンジニアとソフトウェア エンジニアの大規模なチームが、データ、シミュレーション システム、最先端の 人工知能 (AI) トレーニング インフラストラクチャを活用して 自動運転車を道路走行用に準備します。
自動運転車分野のリーダーとして、Teslaは複雑な機械学習インフラストラクチャを開発し、完全自動運転 (FSD) コンピューターを反復的にトレーニングして現実世界の課題を克服すると同時に、Teslaのトレーニング データセットを改善しています。
ここでは、Teslaの「データ エンジン」ワークフローの基礎を調べ、Teslaの車によって生成されたデータが、将来同じ車を再トレーニングするために遡及的にどのように使用されるかを確認します。
テスラのデータエンジンとは何ですか?
テスラの「データ エンジン」は、完全な自律走行への競争における基本的な柱です。この独自のデータ ワークフローでは、実際の運転例を使用して機械学習アルゴリズムを反復的に実行し、それを使用して自動運転ニューラル ネットワークをトレーニングします。
テスラはこれを巧妙な方法で実現しています。各車には2つのFSDシステムを連動して実行するFSDコンピューターが搭載されています。1台のFSDコンピューターは、自動操縦がオンのときに車両の運転と操縦に使用され、もう1台のFSDコンピューターは「シャドウ モード」で常に実行されます。
シャドウ モードは、実際に車を制御しているかのように動作します。それでも、ドライバーが本来の行動とは異なる行動をとったり、提示されたシナリオで何をすべきかわからないという信号をニューラル ネットワークが送ったりすると、その出来事は不正確であると記録されます。テスラはこれらの不正確な情報をメモリに記録するため、遡及的に収集することができます。
テスラが同様の状況下で十分な不正確さを検出すると仮定します。その場合、テスラは、たとえ不正確な点が検出されなかったとしても、テスラの車両群内の他の車両で見つかった同様の運転状況を検索することができます。
その後、Teslaは類似のコンテキスト例を収集できます。テスラは、この新たに形成された適切にラベル付けされたデータセットを使用して、ニューラル ネットワークを再トレーニングし、不正確な情報が提示されたシナリオにより適切に対応できるようになります。ニューラル ネットワークが再トレーニングされると、新しく改訂された自動運転ニューラル ネットワークを「シャドウ モード」に展開し、さらなる不正確さを検出するために新しいデータ例を収集できるようになります。
テスラの高レベルデータ収集
下の画像の視覚的表現は、Teslaのデータ収集と反復戦略の周期的な性質を示しています。まず、ソース(TeslaのFSDコンピューター)でデータが収集されます。次に、車両は不正確さを識別します。この不正確さはテスラのユニットテストに入力され、その正当性と、それが人間のドライバーによる劣悪な運転の結果ではないことが検証されます。
不正確さが正当なものであると判断された場合、テスラは自社の車両群に対し、不正確さが見つかった場所のさらなる例を求める。これらの例は人間によって正しくラベル付けされ、ニューラル ネットワークのトレーニングに使用されます。その後、ネットワークはデータ ソースに再展開され、さらに不正確なデータが収集されます。
自動車産業における競争
テスラが2019年のテスラオートノミーデーで初めて「データエンジン」を発表したとき、当然のことながら、他の自動車業界から羨望の的となった。
2020年にロイターとの会話の中で、アウディのCEOは「コンピューティングとソフトウェアアーキテクチャ、そして自動運転の面でテスラは2年先を進んでいる」と述べた。 データ生成、トレーニング資料の収集、理解、再トレーニングの反復、展開、再実行メカニズムからなるこの大規模なインフラストラクチャは、当初から非常によく設計されていました。
「データ エンジン」は、データ チェーンのあらゆるステップで統合をサポートすることを特徴としており、データの収集、転送、コンピューティングの根本的なアーキテクチャを必要とします。たとえば、Teslaの自動車は、生産に導入された自動運転車のアルゴリズムを実行しながら、Teslaの中央データベースへの ワイヤレス接続 を機能的にサポートし、シャドウ モードのコンピューティングとデータ収集をサポートできます。発表時点では、テスラほど堅牢かつ成熟した自動運転車のデータ収集インフラを備えた自動車メーカーは他になかった。
エッジケースの特定と反復
データ エンジンの最も重要な機能の1つは、人間の運転または生産ニューラル ネットワークと、シャドウ展開されたニューラル ネットワーク間の不正確さを検出する機能です。テスラは、Autonomy Dayのプレゼンテーションで、道路上に自転車が存在する場合に運転の不正確さを検出する例を使用して、テスラの機械学習インフラストラクチャの複雑さと、これらの不正確さを識別する能力を説明しました。
テスラは、自転車に乗る人が乗っていることが多いことから、生産用ニューラルネットワークでは自転車を避けることが重要だとみなした。テスラが2つの物体のうちの1つと衝突する必要がある場合、自転車よりも自動車の方がドライバーを保護する可能性が高いため、自転車ではなく別の自動車と衝突するでしょう。
しかし、テスラは、場合によっては自転車が道路の真ん中、他の車のすぐ近くにあり、シャドウニューラルネットワークがドライバーの行動と比較して何をすべきかわからないことを示すことに気づいた。あるいは、テスラは、自社の生産用自動操縦ニューラルネットワークが稼働しているときに、自転車が「道路の真ん中」にあることが検出された場合、人間の運転手が介入して車の進路を「修正」した可能性があることに気付いたのかもしれない。
テスラに通知が届くと、データラベリング技術者が不正確さを監査し、車に自転車ラックがあり、そこに自転車が取り付けられていたときに不正確さが発生していることを発見した。
人間にとって、この出来事は単なる目新しい出来事だっただろうが、このトレーニングデータは、自動運転車の生産ニューラルネットワークに対する重大な課題を明らかにした。このシナリオでは、テスラはFSD対応車両群に、車上または車の近くに自転車がいた可能性のある他のイベントを検索するように指示しました。
これらのデータ例はデータラベリング技術者に送信され、実際の自転車、車の後ろに取り付けられた自転車、車の上に取り付けられた自転車、または上記のいずれでもない自転車を正しく識別しました。新たに収集されラベル付けされたデータセットを使用することで、ベータ版ニューラルネットワークをテスラの機械学習データセンターで再トレーニングし、フリート全体に再展開してシャドウモードで実行し、反復処理することができます。
Teslaはデータ エンジンを使用して、シャドウ モードの展開と高速トレーニングの反復から得た学習を使用して、新しいソフトウェア リリースを作成できます。テスラのデータ収集インフラストラクチャの優れた点は、実際のデータ例を集め、人間のドライバーを使用して機械学習モデルをトレーニングしていることです。最終的に、Teslaのデータ エンジンは、適切にラベル付けされた実際の自動運転車のトレーニング データを迅速に収集し、それを積極的に使用して反復的な機械学習トライアルを実施することで、ニューラル ネットワークのトレーニングを加速します。
テスラのデータ収集が勝利
自動運転車分野の他の企業も、自動運転車を訓練する独自の方法を持っているが、テスラほどの規模で運用している企業はない。テスラは世界中に自動車を所有することで、より多くの安全運転データとエッジケースの不正確さを収集し、それを使ってニューラルネットワークを教育することができます。
他の多くの企業は非常に堅牢なトレーニング シミュレーションとデータ収集メカニズムを備えていますが、多くの場合、その作業範囲は単一の都市または地域に限定されています。いずれにせよ、自動運転車(現時点では半自動運転車のみ)によって生成されるデータは、自動運転車への扉を完全に開くための不可欠な鍵となる。