「強くしながら封じる」AnthropicのClaude 4.7 Opus、悪用防止を設計に組み込む

2026年4月16日

Anthropicが悪用防止を組み込んだ高性能AI「Claude 4.7 Opus」を公開

URLをコピーしました！

AIの性能を上げながら、悪用できる機能はわざと削る——4月16日、アメリカのAI企業Anthropic（アンソロピック）が新モデル「Claude 4.7 Opus」を発表した。AnthropicはChatGPTで知られるOpenAIと並ぶAI開発の主要企業で、会話AI「Claude」シリーズを手がけている。今回のモデルは、コーディング性能の大幅な引き上げと、悪用対策の設計への組み込み——その両立を軸に据えた。まず、何がどれだけ強くなったのかを見ていく。

コーディングと画像認識が実測で大幅向上

「本番で動くコード」が前世代の3倍 — ベータテストの計測結果

AIにコードを書かせたとき、「実際の業務で動くコードが返ってくる確率」——それを測るベンチマーク（CursorBench）で、Claude 4.7 Opusは70%を記録した。前のモデルは58%だった。数字だけ見ると地味に聞こえるかもしれないが、「10回書かせたうち6回しか使えなかったものが7回使えるようになった」と読み替えると、現場で積み重なる差は小さくない。

Anthropicがベータ段階で集めたデータによると、コーディング作業全体で平均13%の性能改善が確認されている。実務に近い環境での計測であり、ベンチマーク上だけの話ではなく、日常業務への影響として出てきた数字だ。

楽天グループは社内のデバッグ作業にこのモデルを使い始めた。デバッグとは、何十万行もあるプログラムの中からバグ——不具合の原因となるコードの誤り——を見つけて修正する作業だ。楽天が評価したのは「余計な変更を加えずにピンポイントで直せる」点だという。バグを直そうとして別の場所を壊し、新たなバグを生む。そういう連鎖はエンジニアの現場では珍しくない。その連鎖を抑えられることが、大規模なコードを日々扱う企業にとっての実質的な価値になっている。

画像解像度が3倍超に、図面・UI読み取りが実用レベルへ

変化がより際立つのは、画像を「読む」力だ。

グラフの中の数値、設計図の細かい文字、画面に映ったボタンのテキスト——従来のモデルはこうした「画像に含まれる情報を正確に取り出す」ことが苦手だった。視覚テストのスコアは54.5%で、半分強しか正確に読めていなかった計算になる。

Claude 4.7 Opusではそれが98.5%まで上がった。処理できる画像の大きさも従来比3倍以上に拡張されたことで、縦に長いウェブページ全体や、複数のグラフが並んだ資料をまるごと読み込んで分析できるようになった。「ぼんやり見える」から「ちゃんと読める」への変化は、AIを業務フローに組み込む上で現実的な壁を一つ取り除く。

能力を高めながら、悪用できる機能を意図的に封じた

ところが、Anthropicはこの性能をそのままの形では出さなかった。

Anthropicの公式説明によると、今回の発表の1週間前、同社は「Claude Mythos（マイトス）」という、4.7 Opusよりもさらに高性能なモデルを一部の限定ユーザーに公開していた。4.7 Opusは、そのMythosをベースに、サイバー攻撃——コンピューターシステムへの不正侵入や破壊工作——に転用できる機能を意図的に低く設定し直してから、一般に公開したバージョンだ。「出せるのに出さない」という選択をした。AI企業が性能競争の中で「あえて弱くして出す」のは、異例のことだ。

危険な指示を自動検知・拒否するセーフガードを標準搭載

たとえば「このソフトウェアのセキュリティの穴（脆弱性）を突く方法を教えろ」「このシステムに侵入するコードを書け」——Claude 4.7 Opusにこうした指示を出すと、モデルが自動で検知して拒否する仕組みが最初から組み込まれている。

Anthropicが4月16日の発表で明らかにしたところによると、この対策はApple、Microsoft、Googleと連携する「Project Glasswing（プロジェクト・グラスウィング）」という枠組みの中で共同開発された。テクノロジー業界の主要4社が安全対策を一緒に作ったという事実は、これが一企業の方針ではなく、業界全体で取り組む問題として認識されていることを示している。

AIが賢くなるほど、犯罪に使える能力も上がる。この矛盾はAI開発者が長く抱えてきた問題だ。今回Anthropicが出した答えは、「強くなった部分のうち危険な部分だけを削る」というものだった。

脆弱性調査・ペネトレーションテスト向けに審査制プログラムを新設

ただし、一律に封じたわけでもない。

セキュリティ研究者やペネトレーションテスター——企業から依頼を受けてシステムの弱点を意図的に突き、事前に脆弱性を発見するセキュリティの専門家——にとって、AIの高度な機能は正当な業務ツールになる。そうした用途を切り捨てないために、「Cyber Verification Program（サイバー検証プログラム）」が新設された。審査を通過した正当な目的の研究者・専門家には、制限された機能へのアクセスが認められる設計だ。申請方法や審査基準の詳細はAnthropicが順次公開するとしており、現時点では参加希望者の受け付けが始まっている段階だ。「誰に何を許すか」を制御する仕組みを作ることで、封じることと使えることを両立させた。

この設計思想——性能を上げながら、危険な部分だけを意図的に削る——が今、業界で注目されている。競合他社が全機能を解放して性能で競う中、Anthropicは「封じた上で勝つ」という方向に賭けた。その賭けが成立するかどうかの答えは、まだ出ていない。

タスク予算・主要クラウドへの展開を同時発表、価格は据え置き

封じた上で、価格は前のモデルと同じまま——企業がモデルを選ぶときに真っ先に見る条件が、今回の発表に一通り揃った。

エージェントのコスト上限を設定できる「タスク予算」がベータ公開

今回の発表に合わせて、「タスク予算（Task Budgets）」という機能がベータ版として公開された。

AIを「エージェント」として使う——つまり、人間が細かく指示しなくても、AIが自分で判断しながら複数の作業を自律的にこなす使い方——が広まりつつある。便利な反面、AIが処理を繰り返すたびにコストが積み上がり、気づかないうちに想定外の請求が発生するリスクがある。

タスク予算は、その暴走に歯止めをかける仕組みだ。「このタスクにはここまでの処理量を上限とする」と事前に設定しておけば、AIが上限に達した時点で処理を止める。コスト管理を人間が握り続けられる設計で、大量の自動処理を業務に組み込みたい企業には実用的な安全装置になる。

AWS・GCP・Azureで即日提供、GitHub Copilotも数週間以内に移行

Claude 4.7 Opusは発表当日から、Amazon Bedrock、Google Cloud、Microsoft Azureの3つのサービスで使えるようになった。これらはインターネット経由でコンピューターの処理能力を提供する大手サービスで、多くの企業がシステムの基盤として利用している。既存の環境からそのまま新モデルにアクセスできるため、追加の大きな設定変更はいらない。

プログラマーが日常的に使うコード管理サービス「GitHub（ギットハブ）」が提供するAIコーディング支援ツール「GitHub Copilot（コパイロット）」も、数週間以内に4.7 Opusへ移行する予定だ。コードを書く現場に恩恵が届く経路として、もっとも早い選択肢の一つになる。