モノのインターネット (IoT) の新しい世界により、SF映画のシナリオが急速に現実になりつつある時代が到来しました。私たちのほとんどは、トニー・スタークが自然な会話でジャーヴィスと対話したり、手で3Dホログラムを操作したり、ジャーヴィスから重要人物が到着したことを通知されたりするシーンを覚えているでしょう。こうした出来事は見ていて面白いものですが、私たちは実際にこのようなシステムを現実世界で作成できる時代に到達しました。
センサー 技術の進歩により、自動化されたデバイスは、極めて強力な処理能力がなくても、音、画像、その他のデータをインテリジェントに解釈できるようになりました。その結果、マシンツーマシン (M2M) インタラクションの自律性を高めたり、人間とマシンのインタラクションのためのより自然な知覚ユーザー インターフェイス (ジェスチャー、自然な会話、顔の表情、物体認識、その他の非従来型の コンピューティング システムへの入力を解釈して反応するユーザー インターフェイス) を提供したりできる、コンパクトで低電力のシステムを設計できるようになりました。
知覚的ユーザー インターフェースの初期の例はうまく機能していましたが、多くの場合、私たちにさらなる機能を求める独特の制約がありました。AppleのSiri、Googleの音声検索、 MicrosoftのKinect は、デバイスを操作する新しい方法を提供しましたが、テクノロジが設計どおりに機能するには条件が適切でなければなりませんでした。音声クエリの解釈には静かな環境が必要で、多くの場合クラウドで処理されたため、信頼性の高いブロードバンド インターネット接続が必要でした。初期の音声認識システムが設計どおりに機能していたとしても、最良の結果は、特定のキーワードに焦点を合わせるように検索フレーズを設計することで得られました。Kinectのような光学追跡システムには、良好な照明条件と、視野内に反射面がないことが求められます。特別な追跡デバイスがなければ、これらのシステムは依然として大きな動きしか捉えられず、小さな動作はほとんど無視されます。マシン ビジョン システムにも限界があります。モーション センシング機能があるにもかかわらず、モーション検出セキュリティ システムは「何か」が変化したことしか認識できず、トリガー レートが高いため、適切なアクションを決定するには人間がすべてのイベントを確認する必要がありました。
M2MやIoTデバイスでさえ、セットアップや制御には通常、多大な労力がかかります。スマートフォンやコンピューターを使用してこれらのデバイスをプログラムおよび制御するために必要な手順は、特にデバイスに直接近づいて制御する場合と比較すると、それらの「接続」状態の価値をしばしば打ち消します。最新かつ一見最も優れたイノベーションでさえ、依然として限界があります。 Amazonのエコー およびGoogleのHubは、遠距離のシナリオでの背景ノイズに関連する制約を克服し、自然な会話とコンテキストを理解できますが、コマーシャルでキーワードが聞こえると誤って起動する可能性があります。さらに、オーディオ処理の大部分は依然としてクラウド接続に依存しています。
従来のセンシングシステムの限界を克服
しかし、エンジニアリングの世界は決して止まることなく、多くの企業がモノのインターネットに高度な自然言語処理やその他の直感的なコントロールをもたらすために懸命に取り組んでいます。組み込みの音声認識、視覚処理システム、その他のセンシング技術は、知覚ユーザー インターフェイスが「どのように機能するべきか」という私たちの考えが、実際の機能にほぼ反映されるところまで到達しています。
自然言語と高度なオーディオ プロセッサにより、インテリジェントな方向検出とビームフォーミングにより遠距離の音声コマンドの認識が向上し、音声コマンドと広告からの誤ったトリガーを区別できるようになります。オンチップオーディオ処理も現実のものとなりつつあり、これによりデバイスはクラウドベースの音声解釈システムから解放され、インターネット接続がなくても動作する自律操作が可能になります。 Conexant と Microsemi は、自然音声処理におけるこれらのイノベーションをリードする2つの企業です。 ConexantのAudioSmart テクノロジーは、マルチチャネルの高ダイナミックレンジオーディオセンサーを活用して、音声対話型テレビやセットトップボックス、スマート家電、テレプレゼンス、ゲームコンソール向けの最先端の遠距離音声認識を提供します。 MicrosemiのTimberwolfプラットフォーム上のAcuEdge センシングソリューションは、到達方向、ビームフォーミング、マルチチャネルエコーキャンセルなどのテクノロジーを遠距離オーディオプロセッサにもたらします。これにより、IoT、セキュリティ、自動車用デバイスは、ノイズの多い環境で動作し、重要な信号を選択して処理の優先順位を付け、さらに、ユーザー コマンドと、所有者、ゲスト、または乗客以外のTVコマーシャルやその他のオーディオ ソースから「聞き取った」コマンドを区別できるようになります。
新しい自然言語システムには、接続されたIoTデバイスを音声で制御できる機能も備わっています。Amazon EchoとGoogle Hubはすでに、自然言語インターフェースを使用して、ユーザーがWeMoとThreadを介して2.4 GHz IoTデバイスと対話できるようにしており、簡単な音声コマンドに基づいてタスクを完了できる低電力SoCベースのガジェットに多くの機会をもたらします。BelkinのWeMoは2.4 GHz 802.11標準に基づいて構築されているため、IoTデバイスに簡単に実装できますが、802.11のより高い電力要件により、外部電源を備えた家電製品やその他の接続デバイスに適しています。これらのアプリケーションに最適な低電力802.11 SoCの例としては、 CypressのCBM4390Xファミリ やAtmelの ATWINC1510 IoTモジュールなどがあります。Threadは、6LoWPANと802.15.4をベースに構築された新しいワイヤレス メッシュIoTプロトコルで、超低電力IoTデバイスに最適です。他の802.15.4プロトコルに比べて、IPアドレス指定が可能で、デバイスのセキュリティを高めるためにAES暗号化が組み込まれているなど、いくつかの明確な利点があります。 NXP はThreadの創設メンバーであり、同社の FRDM-KW41Z Freedom開発ボードは、Thread接続デバイスのプロトタイプを迅速に作成するのに最適です。
ハイダイナミックレンジ(HDR)イメージングセンサーの進歩は、自動車、産業、セキュリティ、ウェアラブル、その他のアプリケーション向けに高度なセンシングソリューションを提供する OmniVision と ON Semiconductorの Aptinaブランドから生まれています。これらのセンサーにより、マシンビジョンシステムは、画像プロセッサで解析しやすい高品質のビデオをキャプチャできます。これにより、カメラシステムの顔検出、オブジェクト追跡、その他の高度な処理が向上し、検出および処理アルゴリズムの信頼性が大幅に向上します。メリットは多岐にわたります。自動化された検査および組み立てシステムは、より高速かつ高品質で動作でき、ロボットとドローンは安全性と自律性を高めて移動でき、セキュリティおよび監視システムは、オペレーターの確認の必要性を最小限に抑えるか排除し、他のマシンやシステムと直接対話できます。 Omnivisionの OV106xx HDRビデオ キャプチャ デバイス ラインとOnSemiの AR0230 および AP020x HDRセンサーおよびイメージ プロセッサにより、デバイスは周囲の環境を十分な詳細度でキャプチャしてインテリジェントに応答できるようになり、明るい光源によって画像が白飛びしたり重要な詳細が不明瞭になったりする問題を回避できます。
ユーザーインターフェース用の新しいタイプのセンサー
しかし、これらの進歩にもかかわらず、マシンビジョンシステムは、ジェスチャーのような細かい部分を識別する必要があるウェアラブルやその他のデバイスとのやり取りにはまだ理想的とは言えません。低電力の静電容量式および誘導式センシングソリューションは存在し、これらのニーズの一部を満たすことができますが、低電力レーダーの革新的なアプリケーションにより、ウェアラブル、電話、コンピューター、車、その他のIoTデバイス向けの超低電力で高精度なジェスチャーセンシングが導入されています。レーダー技術のこれらの進歩は、GoogleのプロジェクトSoliによって開発されています。これは、 インフィニオン レーダー技術を使用して仮想ツールジェスチャー(手の指の間で仮想コントロールを操作する)を可能にするGoogleの技術。ボタン、ダイヤル、ノブ、スライダー、その他の2次元または3次元の動きを仮想化でき、ユーザー自身の指が触覚フィードバックを提供し、操作が非常に自然に感じられるようになります。この技術の最も印象的な初期のデモンストレーションの1つは、アナログ時計をセットするためにリューズを使用する動作を模倣したジェスチャーを使用するスマートウォッチのデモンストレーションです。ただし、ダイヤルやその他の設定を調整するために実際に時計に触れる必要はありません。この技術やその他の革新的な仮想コントロール メカニズムは、Project Soliの紹介ビデオで取り上げられています。
これらの進歩は 感知 M2MおよびIoTデバイスに新しい機能をもたらし、ユーザーとこれらのデバイスとのやり取りをこれまで以上に自然なものにしています。その可能性は実に驚くべきもので、まるで映画から現実に持ち出されたSFの世界のようです。
さらに詳しく知りたい場合は、ニュースレターを購読して最新ニュースを入手してください。