グラフィックス プロセッシング ユニット (GPU) は、自動運転技術用の最も主要なチップ アーキテクチャとして登場し、現在では多くの先進運転支援システム (ADAS) 対応車両に搭載されています。エッジ コンピューティングとソースで直接処理される機械学習 (ML) の登場により、GoogleのAIテンソル処理ユニット (TPU) などの新しいアーキテクチャにより、自動運転車の計算能力が劇的に拡張され、既存のシステムに必要な電力のほんの一部しか消費しなくなります。
2004年、カーネギーメロン大学レッドチームが第1回DARPAグランドチャレンジのために開発した 初の自律走行車の1つであるSandstormは、経路計画用の4プロセッサItaniumサーバー、LiDARおよびレーダーユニットからの画像処理用のデュアルXeonコンピューター、ドライブバイワイヤ制御用のPentium III PC104など、50 kgを超えるコンピューティング機器を搭載していました。
今日、私たちはどこにでも持ち歩くポケットデバイスの中に、より多くの処理能力を詰め込んでいます。
GPUの誕生
1999年、 Nvidia Corporation はGPUの発明を発表し、これを「1秒あたり最低1,000万ポリゴンを処理できる、変換、ライティング、三角形のセットアップ/クリッピング、レンダリング エンジンを統合したシングル チップ プロセッサ」と定義しました。
Nvidiaによれば、最新のGPUは1秒あたり70億以上のポリゴンを処理します。136億個のトランジスタを搭載したNvidia Quadro RTX 5000 1台で、最大348.5 GFLOPSの処理能力を誇ります。
GPUは過去10年間で大きな人気を博し、現在ではゲーム、コンピューター支援設計、高頻度取引、DNAおよびRNAシーケンシング、ブロックチェーン技術、暗号通貨マイニングなど、多くのアプリケーションで使用されています。
コネクテッドカーや自律走行車 (AV) ではグラフィック データやマップの膨大な処理が必要となるため、自律走行車の操作に関する多くのタスクにはGPUが当然の選択肢となります。
2017年、Nvidiaはトヨタとの提携を発表し、同社の自動運転車にNvidiaのDrive PXシリーズ人工知能プラットフォームを採用すると発表しました。Drive PX Pegasusシステムは、2つのXavier CPU/GPUデバイスと2つのポストVolta (Turing) 世代GPUをベースにしており、8 TFLOPSのピーク性能を提供します。テスラは、電気自動車のADASと自動運転機能に同じプラットフォームのカスタムバージョンを使用しています。
NvidiaのDriveシリーズの次期モデルであるAGX Orinは、170億個のトランジスタ チップで、現在のPX Pegasusのトランジスタ数のほぼ2倍であり、大型で非常に強力な自動車用SoCのトレンドを継続しています。
TPUコア: 機械学習のためのGPUコンパニオン
2016年、 グーグル テンソルプロセッシングユニットと呼ばれる「ディープラーニング推論」用の新しいプロセッサアーキテクチャの開発を発表した。
ブログ記事によると、 「 TPUは機械学習アプリケーション向けにカスタマイズされており、計算精度の低下に対するチップの耐性が高まり、操作ごとに必要なトランジスタの数が少なくなります。これにより、シリコンに1秒あたりにさらに多くの操作を詰め込み、より高度で強力な機械学習モデルを使用し、これらのモデルをより迅速に適用できるようになり、ユーザーはよりインテリジェントな結果をより迅速に得ることができます。TPUを搭載したボードは、データセンター ラックのハード ディスク ドライブ スロットに収まります。」
GoogleのTPUは当初から、Googleマップやストリートビューなどのマッピング アプリケーションの精度を向上させることを使命としていました。
第2世代と第3世代のTPUは、それぞれ2017年5月と2018年5月にGoogleによって発表されました。第2世代の設計では、帯域幅が600 GB/秒、パフォーマンスが45 TFLOPSに向上し、第3世代では前世代のパフォーマンスが2倍になりました。
そして2018年7月、Googleはエッジ コンピューティング用のMLモデルを実行するために設計された専用のASICチップである Edge TPU を発表しました。
Drive PXやDrive AGXシリーズなどの最新のNvidiaグラフィック プロセッサには、機械学習用のテンソル コアもいくつか含まれています。
車は新たなクラウドと機械学習処理ユニットになる
現在コネクテッド ビークルで一般的になっている計算能力の利点の1つは、それを機械学習や大量データ処理に使用できる可能性があることです。
上で説明したように、GPUはグラフィック操作と浮動小数点処理の分野で従来のCPUに比べて多くの利点があります。AVの動作中、GPUは計算リソースの大部分を車の運転タスクに割り当てる必要があり、アイドル時間にはその計算能力を他のアプリケーションに使用できます。
さらに、コネクテッドカーや自動運転車が街路や高速道路を走行すると、周囲の環境、システム、走行ルートに関する膨大なデータが収集されます。
その膨大な量のデータは、機械学習アプリケーションやサービスにとっての金鉱です。
現在の機械学習環境では、エッジ デバイスによって収集されたデータは処理のためにクラウドに継続的に送信され、それらのデバイス上の処理ユニットをトレーニングするための新しい更新されたアルゴリズムが生成されます。
しかし、AVのプロセッサのパワーがあれば、その計算能力を使って車内でMLマシンを実行することが可能です。このようにして、各車両は収集したデータに基づいて自らをトレーニングすることができます。
そして、第5世代のセルラー ネットワーク (5G) の登場により、コネクテッド ビークルのパワーの新たな用途が生まれます。低遅延やネットワークスライシングなどの強力な機能を備えた5Gに接続された車両は、近接する車両をリンクする仮想クラウド ネットワークを作成する手段を提供できます。何千台もの自動車が、5Gインフラストラクチャのキャリア、コネクタ、オンザフライ ストレージになることができます。当然のことながら、セキュリティは主要な懸念事項の1つです。高度に接続された車両のネットワークは、ハッカーやネットワーク障害、自然災害などの脅威から保護する必要があります。