機械知能とも呼ばれる 人工知能 (AI) は、機械が人間のように「考える」ことを可能にします。AIは、問題を解決したりタスクを実行したりしながら、認識、学習、分析、推論を行うことができます。
ほとんどの研究者は、AIのこれら4つのタイプ/レベルに同意しています。タイプIにはメモリがなく、現在の入力にのみ反応します。タイプIIでは、意思決定の参考にできる記憶が限られています。タイプIIIは記憶容量と意思決定能力を拡大します。タイプIVは、自分自身と自分の感情、そして他者の感情を認識するAIのレベルを表します。現時点では、タイプIとタイプIIは豊富に存在していますが、タイプIIIとタイプIVは概念上のみ存在しています。
これら4つのタイプには、学習と推論 (意思決定) という2つのAIコンポーネント、つまりフェーズがあります。
AIにおける学習とは何ですか?
人間と同様に、AIもタスクを実行する前にそれを学習する必要があります。人間の脳は情報を整理し、次に同じ情報や類似の情報に遭遇したときにそのデータを使用して迅速な判断を下せるようにします。
同様に、コンピュータ アルゴリズム、つまり問題解決プロトコルは、外部データ入力からのパラメータを使用して思考モデルを生成します。これは、将来の問題を効率的かつ最小限のエラーで解決するように設計されたプロセスです。
AI機械学習のカテゴリは数多くあります。この記事では、いくつかの基本的なカテゴリの適用について紹介し、説明します。これらには、教師あり学習、教師なし学習、強化学習が含まれます。半教師あり学習などのハイブリッド学習や、転移学習やアンサンブル学習などの基本的な学習タイプに基づく学習手法についても説明します。
さまざまなタイプのAI学習とその応用
教師あり学習
教師あり学習は、最も一般的に使用されるタイプの機械学習です。
教師あり学習の目標は、入力データを記述するアルゴリズムをトレーニングして、エラーが最小限でデータ出力を生成できるようにすることです。学習の「教師あり」の側面とは、対応する既知の出力を持つラベル付きデータセットの使用を指します。教師が生徒を正しい答えに導くのと同じように、ラベル付けされたデータはアルゴリズムを許容できるレベルの正確さへと導きます。
教師あり学習の問題は、回帰問題と分類問題で構成されます。分類問題の出力はカテゴリですが、回帰問題の出力は指定された単位の数値です。
教師あり学習の応用には、金融システムにおける矛盾の特定 (回帰) や、顔、物体、音声、ジェスチャー、手書きの認識 (分類) が含まれます。
教師あり学習は、 ニューラルネットワーク。ニューラルネットワークは、異なるタイプのデータを数値に変換する入力層と、 データを分析する、そして結果を吐き出す出力層です。このプロセスでは、分析のレイヤーによって、傾向やパターンを識別できる思考システムの階層が形成されます。
畳み込みニューラル ネットワーク (CNN) は、画像、音声、テキストなどの信号間の空間関係を抽出し、保存し、分析して、さらに分析します。顔認識と音声認識と 自動運転車の運転 これらのCNNの機能に頼ります。
リカレント ニューラル ネットワーク (RNN) では、出力がネットワークにフィードバックされて修正されるため、システムは間違いから学習し、正しい予測の割合を増やすことができます。RNNは、入力が通常長く、コンテキストが豊富なテキストから音声への変換に非常に適しています。たとえば、RNNは、「here」と「hear」のように発音が同じ異なる単語や、「crane」、「date」、「leaves」、「point」のように複数の意味を持つ単語を区別できます。
画像、音声、手書き文字認識に加えて、教師あり学習は次のような分野でも応用されています。 バイオインフォマティクス、電子メールスパム検出、パターン認識など。特に、パターン認識能力により、 スマートファクトリー電力網や工場にコスト削減策を講じるよう要請した。
教師なし学習
ラベル付きデータセットは教師あり学習に強力な制御をもたらしますが、収集されたデータのほとんどがラベル付けされていないため、かなりの時間と労力も必要になります。
教師あり学習とは異なり、教師なし学習は、対応する出力や予想される出力のないラベルなしデータを使用してトレーニングされます。このタイプの学習には教師も正解もありません。
その結果、教師なし学習によって、分類のためのこれまで知られていなかったデータ パターンや特徴が明らかになる可能性があります。教師なし学習では教師あり学習よりも複雑な問題を解決できますが、その出力にはより高い不確実性が伴います。
教師なし学習の主な種類には、クラスタリングと関連付けの問題が含まれます。
過去の投票履歴に基づいて有権者をグループ化することは、クラスタリング アプリケーションの一例です。他の例としては、買い物客を過去の購入履歴でグループ化したり、医療患者を遺伝的特徴やライフスタイルのパターンでグループ化したりすることが挙げられます。もう1つの例は、最近傍問題です。ここで、アルゴリズムはモデルを生成しませんが、利用可能なすべてのケースを保存し、同様の方法に基づいて新しいインスタンスを分類します。
適切な質問をしたり、適切な方法で質問したり、さまざまな角度から質問したりすることで、異常を明らかにする可能性のあるさまざまなデータ構成をモデル化できます。たとえば、クレジットの使用のシナリオでは、100件の取引のうち99件が米国で発生し、中国では1件だけ発生するのはなぜかという質問をすると、不正な金融取引が明らかになる可能性があります。
関連付けは、大規模なデータベース内の変数間で新たに発見された関係に基づいて傾向を予測するために適用できます。関連付けの例としては、買い物客の過去の購入履歴に基づいて、その買い物客の将来の購入履歴を予測することが挙げられます。
上記とは異なるタイプの学習には、強化学習、半教師あり学習、転移学習、アンサンブル学習などがあります。
AI推論とその仕組み
トレーニング フェーズでは、アルゴリズムによって新しいモデルが生成されるか、最適化されたパラメータを使用して事前トレーニング済みのモデルが再利用されます。モデルのテストが完了すると、推論タスクに展開する準備が整います。推論フェーズでは、学習したパラメータに基づいて新しいデータに関する予測と決定が行われます。推論には指定されたパラメータ内での計算が含まれるため、学習フェーズよりもはるかに速く実行されます。
学習と推論: 処理、ストレージ、エネルギー需要、ネットワーク
AIの学習フェーズと推論フェーズでは、エネルギー消費量、処理能力、データ ストレージの要件が異なります。さらに、ネットワーキングも問題点です。
学習には、かなりの時間、 計算能力、および電気エネルギーが必要です。データセットを使用したトレーニングとモデルの構築には、何千時間もの計算が必要です。その結果、トレーニングには大量の電力が消費されます。対照的に、推論フェーズでは必要な処理が少なくなり、消費電力も少なくなります。推論には学習よりもはるかに少ない計算量しか必要ありません。その結果、より少ないエネルギーで済みます。
さまざまなタスクの時間枠も重要です。航空会社のメンテナンス データの分析など、一部のタスクでは処理に数時間かかります。一方、国境管理や保険金請求などの顔認識や画像認識のタスクでは、処理時間ははるかに短くなります。タスクをより短い時間枠で実行する必要がある場合、より多くの処理能力が必要となり、したがってより多くの電力消費と、おそらくより多くのデータストレージが必要になります。規模の問題もあります。指数関数的に増加するデータを処理しても直線的な改善しか得られないため、企業は精度を大幅に向上させるために毎日より多くのデータを収集、分析、保存する必要があります。
ストレージのニーズに違いがある可能性があります。医療、科学、セキュリティ分野の画像認識やビデオ認識タスクでは大きなファイルが使用されるため、データ ストレージの必要性が大幅に高まります 。一方、金融詐欺検出やサプライチェーン分析などのタスクでは、必要なデータストレージははるかに少なくなります。全体として、データは単に保存するだけでなく、効率的な検索と分析を可能にするために効果的にウェアハウス化される必要があります。したがって、ストレージから分析へのデータのスループットまたは大量配信が、もう1つの問題点になります。
ネットワークももう一つの懸念事項です。クラウド コンピューティングでは、中央サーバーから離れて収集されたデータは、分析のために中央クラウドに送られます。データ転送速度の制限と転送する必要があるデータ量により、かなりのタイムラグ(遅延)が発生します。データが読み取られ、再読み取りされると、このような遅延はさらに悪化するだけです。
AI学習と推論をエッジに移行する利点
IoTクラウド コンピューティング、つまり物理的なセンターで行われる計算は、処理、エネルギー消費、ストレージの面で、上記の問題に対していくつかの利点を提供します。
中央クラウドには通常、強力なプロセッサが搭載されており、企業は必要に応じていつでも処理能力とストレージ容量を追加できます。中央サーバーは電力網に接続されているため、通常はエネルギー消費が問題になることはありません。
ただし、クラウド コンピューティングの遅延とネットワークのボトルネックが問題になる可能性があります。
処理とストレージをスケールアップしても、レイテンシの問題は解決されません。実際、処理とストレージのスケールアップは、IoTエッジからクラウドに転送するデータ量の増加を意味し、混雑が悪化します。レイテンシが増加すると、迅速な推論やリアルタイムの推論を要求する自律走行車、公共グリッド、軍用ドローンなどのアプリケーションは不可能になります。
コストの観点から見ると、データ転送はすでに高価であり、データ転送を増やすと総コストが増加するだけです。クラウドに送信される収集データのほとんどは分析とは関係がないため、データ転送は時間とコストの観点から非常に非効率的です。さらに、データ転送はデータセキュリティにリスクをもたらします。最後に、データ転送によってデータの整合性が損なわれ、データの取得や分析が妨げられる可能性があります。
エッジコンピューティングの課題: エネルギー効率、データストレージ、処理ニーズ、データセキュリティ
クラウド コンピューティングのレイテンシ問題を解決する1つの方法は、機械学習をエッジに近づけることです。エッジ コンピューティングでは、大量のデータを転送する必要性を回避しながら、データが収集され、迅速に推論に到達するように分析されます。その後、データセット全体の一部である関連データのみを中央クラウドに移動して、さらに分析する必要があります。こうすることで、データ転送にかかる費用とデータ転送による混雑を一挙に解決できます。
ただし、エッジ コンピューティング モデルには弱点がないわけではありません。データ処理の大部分が中央クラウドから離れるにつれて、システムはデータ分析とストレージのために強力な中央サーバーに依存できなくなり、エッジ サーバーのパフォーマンスとストレージ機能に対する需要が高まります。
まず、エッジIoTサーバーの計算能力は、大規模なデータ処理に対応できる必要があります。高い処理能力は高いエネルギー消費に相当し、エッジでのエネルギー供給に圧力をかけます。エッジIoTサーバーはバッテリーで駆動され、遠隔地に設置される場合があり、その結果、バッテリーの交換が困難になります。スマートIoT センサー は消費電力は少ないですが、必要な処理能力を備えていない可能性があります。したがって、処理パフォーマンスと低エネルギー消費の要求のバランスを取ることがエッジ コンピューティングの課題となります。
したがって、エッジ コンピューティングを成功させるには、エッジ サーバーのエネルギー効率を高めるソリューションが必要です。たとえば、AIの学習フェーズはクラウドで実行され、その後推論のためにエッジに展開されます。また、より単純な計算タスクの一部をエッジ サーバーから、よりエネルギー効率の高い フィールド プログラマブル ゲート アレイなどのデバイスに移動することもできます。
結論
エッジ コンピューティングは、レイテンシとデータ転送コストを削減することで、クラウド コンピューティングの2つの問題を軽減できます。しかし、エッジ コンピューティングは、エネルギー消費の削減と効率化、データ ストレージと処理パフォーマンスの拡張、データ セキュリティの強化という課題に直面しています。そのため、エッジサーバー用のより強力なチップを開発し、量子コンピューティングで計算能力を拡大し、学習および推論アルゴリズムを改善し、エッジでのデータセキュリティを強化する必要があります。今後の記事では、さまざまなソリューションと、それらをさまざまな垂直セグメントに適用する方法を検討し、トレードオフを検討します。