スマートフォンのカメラを工場の機械に向けると、AIがその場で故障原因を特定して修理手順を音声で教えてくれる——そんな使い方が、研究室の外に出てきた。
Googleは5月22日(現地時間)、年次開発者会議「Google I/O 2026」で、自社のAI「Project Astra(プロジェクト・アストラ)」を企業の業務で使える形で正式に提供開始すると発表した。
Project Astraは、カメラで映したものや周囲の音声をリアルタイムで理解して答えを返すGoogleのAIだ。ChatGPTのように文章を打ち込んで使うのではなく、スマートフォンやタブレットのカメラを向けるだけで動く。「見て、聞いて、その場で答える」という点が、これまでのAIとの最大の違いになる。
Astraは2024年に初めて公開されたが、当時はあくまで研究段階のデモだった。それが今回のGoogle I/O 2026で、GeminiアプリおよびGoogle Cloudを通じた企業向けサービスとして実装フェーズに入ることが正式に発表された。
注目すべきは、その用途がオフィスのデスクワークではないことだ。工場の生産ライン、小売店の店頭、医療現場——カメラを持って動き回る現場作業者の仕事に入り込む設計になっている。これまでAIの恩恵が届きにくかった領域への本格参入といえる。
発表された用途のうち、現場へのインパクトが大きい機器診断と多言語翻訳の2つを見ていく。
カメラが機器の手順書になる
工場の一角で、作業員がスマートフォンをコーヒーマシンに向ける。画面に文字が浮かぶ——「水タンクのキャップを反時計回りに外してください」。次の手順に移ると、また指示が変わる。マニュアルを探した時間はゼロだ。
故障をその場でステップ診断
Astraの機器診断サポートは、このシーンに凝縮されている。スマートフォンやスマートグラスのカメラで機器を映すと、AIがその機器を識別し、修理手順や部品名を画面にリアルタイムで重ねて表示する。
これまでの現場では、何かトラブルが起きるたびにPDFマニュアルを探し、該当ページを見つけ、手順を確認するという作業が必要だった。Astraはその一連の流れを省く。カメラを向ければ、AIが自動で該当箇所を引き当てる。Googleの発表によれば、応答にかかる時間は0.8〜1.2秒。会話のテンポで使えるレベルだ。
誤操作をリアルタイムで修正
機器の診断にとどまらず、作業そのものを支援する機能も発表された。「Teach and Repeat(ティーチ・アンド・リピート)」と呼ばれる仕組みだ。
熟練の作業員がカメラの前で一度手順を実演する。AIはその動きを記憶し、以後は新人がカメラを向けるだけで「次はこれをしてください」と指示を出す。作業中に誤った手順を踏もうとする動きを検知すれば、その場でリアルタイムに修正を促す。
ベテランの技は長らく「見て覚えろ」の世界だった。それをAIが一度で記録し、誰でも引き出せる形に変える。
商談が「通訳なし」で進む
カメラが「目」として動くなら、音声は「耳と口」として動く。Astraのもう一つの柱が、リアルタイムの多言語翻訳だ。
従来の翻訳AIは、音声をいったん文字に変換し、翻訳して、また音声に戻す——という3段階の処理をしていた。この工程があるため、話してから翻訳が返るまでに数秒かかった。会話のテンポが崩れ、商談の場では使いものにならなかった。
AstraはAIが音声を直接処理して翻訳音声を出力する仕組みに変えた。応答速度は0.8〜1.2秒。これなら会話が続く。
24言語・感情まで認識
しかし、速さよりも驚くべき点がある。翻訳された音声が、話し手本人の声のトーンと抑揚を保ったまま出力される。
従来の翻訳AIが返す声は、どれも機械的な棒読みだった。声から感情が消えるため、「伝わっている感」が出ない。商談や接客でなかなか使えなかった理由の一つはそこにある。
Astraの翻訳音声は違う。元の声に込められた強調や感情を維持したまま、相手の言語に変換される。対応言語は24言語。さらに相手の声のトーンも認識するため、「この相手は今、納得しているのか」を営業担当者にフィードバックする機能も検討されている段階だ。
商談・顧客対応への展開
この機能が実際に試されたのが、あるブティックホテルの事例だ。
フロントスタッフが、海外から来たゲストのパスポートをWebカメラでスキャンする。チェックインシステムへのデータ入力は自動で完了する。それと同時に、Astraがゲストの母国語でリアルタイムに挨拶と案内を始める。
スタッフがその言語を話せなくても、ゲストには自分の言葉で語りかける声が届く。しかも棒読みではなく、感情を乗せた声で。
パスポートを読み取りながら、母国語で話しかける。フロントの画面の前で、それが同時に成立している。
先行企業はすでに動き始めている
ホテル事例にとどまらず、Astraを自社業務に組み込む取り組みは複数の業界で動き始めている。
業務自動化ツールを手がける大手2社が、Astraの「見て判断する」機能を自社製品に統合する開発を開始した。これまで彼らはパソコン上の繰り返し作業を自動化するソフトウェアを提供してきた企業だ。そこにAstraが組み合わさることで、画面を「読む」だけでなく「映像を見て判断する」自動化へと進化する。
視覚障害者向けの遠隔支援サービスAiraは、Googleの早期テストプログラムにすでに参加している。利用者がスマートフォンのカメラをかざすと、Astraが目の前の状況を音声でリアルタイムに説明する仕組みだ。これはすでに実際のサービスとして動いている。
研究段階のデモから、企業が実際の業務に組み込める製品へ——その転換点が、今回のGoogle I/O 2026だ。導入競争は、大きな発表を待たず、静かに始まっている。
