Claude Opus 4.8公開——自己検証を強める「正直さ」と、多数のサブエージェントを束ねる動的ワークフロー

この記事は約11分で読めます。

Anthropicは2026年5月28日(米国時間)、フラッグシップAIモデルの新版「Claude Opus 4.8」を公開しました。前版のOpus 4.7を土台にした段階的な更新で、通常利用の価格は据え置きです。同社が前面に押し出しているのは、モデルの「正直さ(honesty)」の改善と、Claude Code向けの新機能「動的ワークフロー(dynamic workflows)」の2点です。本記事では、Anthropicが公開した一次情報をもとに、Opus 4.8で実際に何が変わったのか、開発・運用の現場でどう使えるのかを整理します。

価格据え置きでの段階的アップデート

Claude Opus 4.8は公開と同時に全プラットフォームで利用可能になりました。前版Opus 4.7が2026年4月16日にリリースされたばかりで、わずか1か月半での更新となり、リリース間隔が短くなっています。Anthropic自身もブログで、Opus 4.8を「控えめだが確かな改善(a modest but tangible improvement)」と位置づけており、抜本的な刷新ではないことを明言しています。一部の海外メディアも「ゲームチェンジャーではない」と評しています。

通常利用時の料金はOpus 4.7から変更されておらず、入力100万トークンあたり5ドル、出力100万トークンあたり25ドルです。APIで利用する際のモデル識別子は claude-opus-4-8 です。

あわせて高速版の「fast mode」も更新されました。fast modeは、同じOpus 4.8をより高速な推論設定で動かすリサーチプレビュー機能で、出力トークン毎秒が最大2.5倍になるとされています。価格は入力100万トークンあたり10ドル、出力100万トークンあたり50ドルで、Opus 4.6/4.7のfast mode価格(30ドル/150ドル)と比べると3分の1です。なお、現時点ではリサーチプレビューに参加する組織に限定して提供されているとの指摘もあり、利用には別途の申請が必要とされています。

最大の訴求点は「正直さ」の改善

Anthropicが今回もっとも強調しているのが、モデルの「正直さ(honesty)」、つまり不確実性を明示し、裏付けのない主張を避ける性質の改善です。同社は、AIモデルには証拠が薄いにもかかわらず「作業が進んだ」と自信を持って主張し、結論に飛びついてしまう一般的な問題があると説明しています。Opus 4.8はこの点が改善され、自分の作業について不確実性を申告しやすく、裏付けのない主張をしにくくなったとしています。

具体的な根拠として、Anthropicは自社評価において、Opus 4.8が「自分の書いたコードの欠陥を見逃す確率が前版の約4分の1」になったと報告しています。AIエージェントがコード変更や運用作業に深く関与する場面が増えるなかで、コード品質を自己点検する能力の向上は、実務上の意味を持ちます。

ただし、ここで一点留意が必要です。これらの「正直さ」に関する主張は、Anthropic自身の評価とアーリーテスターからの報告に基づくものであり、第三者による独立検証の結果ではありません。詳細はAnthropicが公開する「Claude Opus 4.8 System Card」に記載されています。後述するように、重要な作業では引き続き人間によるレビューを前提に置くのが堅実です。

ベンチマーク:いずれもAnthropicの自己申告値

Anthropicによれば、改善幅が大きいのはエージェント的なターミナルコーディング、ナレッジワーク、エージェント的な金融分析の領域です。コーディング能力を測るSWE-Bench Proでは69.2%を記録し(前版は64.3%)、OpenAIのGPT-5.5やGoogleのGemini 3.1 Proを上回ったと主張しています。ツールを用いた多分野推論のスコアも54.7%から57.9%へ向上したとされます。コンピュータ操作の評価Online-Mind2Webでは84%という数値も紹介されています。

これらの数値はいずれもAnthropic自身が実施したベンチマークに基づく自己申告であり、評価ハーネス(測定環境)の違いによって結果が変わりうる点には注意が必要です。Anthropic自身も脚注で、ターミナル系ベンチマークのTerminal-Bench 2.1については全モデルを共通のハーネスで測定した値であり、GPT-5.5が別のハーネス(Codex CLI)で報告したスコアは83.4%だと補足しています。つまり、コーディング系の一部では競合が上回る測定結果も存在します。ベンチマークの優劣は測定条件に依存するため、単一の数値だけで性能を判断するのは適切ではありません。

動的ワークフロー:計画を「コード」に移す新しい仕組み

今回の更新で技術的にもっとも新しいのが、Claude Code向けの「動的ワークフロー(dynamic workflows)」です。現時点ではリサーチプレビューとして提供されています。

仕組みはこうです。ユーザーが課題を与えると、Claudeがその場でオーケストレーション用のスクリプト(JavaScript)を生成し、単一セッションの中で多数のサブエージェントを実行します。公式ドキュメントによれば、1回のワークフローで動かせるエージェントは合計で最大1,000、同時に実行されるのは最大16(CPUコアが少ない環境ではさらに少数)です。つまり「1,000体が一斉に並列実行される」わけではなく、最大16体ずつ動かしながら、合計で最大1,000体まで展開する形です。各サブエージェントの結果は、ユーザーに返される前に検証されます。Anthropicの説明によれば、複数のエージェントが独立した角度から問題に取り組み、別のエージェントがその結果を反証しようと試み、答えが収束するまで反復する、という流れです。

従来のサブエージェントやスキルとの核心的な違いは、「計画をどこが保持するか」にあります。従来はClaude自身がオーケストレーター(指揮役)として、何を起動するかをターンごとに判断し、すべての中間結果がClaudeのコンテキストウィンドウに蓄積されていました。動的ワークフローでは、計画と分岐・ループの判断がスクリプト側に移り、中間状態は会話の外にある変数に保持されます。その結果、Claudeのコンテキストには最終的な答えだけが残り、コンテキスト消費を抑えながら大規模な作業に対応できるようになります。

想定される用途として、Anthropicはコードベース全体のバグハント、認証チェックや入力検証といったセキュリティ監査、数千ファイルにまたがる大規模なフレームワーク移行やコードの現代化、そして判断を誤ると損失が大きい「二重チェックが必要な重要作業」を挙げています。

象徴的な事例として公開されているのが、JavaScriptランタイム「Bun」の書き換えです。開発者のJarred Sumner氏が動的ワークフローを使い、BunをZigからRustへ移植しました。既存テストスイートの99.8%が通過し、規模は約75万行のRust、最初のコミットからマージまで11日間だったとされています。なお、これはまだ本番環境に投入された成果ではありません。

実務上の重要な注意点として、Anthropicは動的ワークフローが通常のClaude Codeセッションよりも大幅に多くのトークンを消費すると明言しています。同社自身が、まず範囲を絞ったタスクで使用感を確かめることを推奨しています。利用にはClaude Code v2.1.154以降が必要で、すべての有料プラン(Pro/Max/Team/Enterprise)に加え、Claude API、Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundryで利用できます。既定の有効・無効はプランによって異なり、公式ブログによれば、MaxプランとTeamプラン、およびAPI経由では既定で有効、Enterpriseプランでは公開時点で既定では無効(管理者が設定で有効化)です。Proプランでは /config の項目から有効化します。起動するには、プロンプトに「workflow」という語を含めるか、effortレベルを ultracode(xhigh相当)に設定する方法があります。

エフォート制御とその他の更新

Opus 4.8の公開に合わせて、いくつかの機能更新も行われました。

1つ目は「エフォート制御(effort control)」です。claude.aiとClaude Cowork上で、モデルセレクタの隣に、応答にかける「労力(effort)」を選ぶコントロールが追加されました。高い設定ではClaudeがより頻繁に深く思考してより良い応答を返し、低い設定ではより速く応答してレート制限の消費が緩やかになります。この機能は全プランで利用できます。Opus 4.8は既定で「high」に設定されており、コーディングタスクではOpus 4.7の既定と同程度のトークン消費で性能が向上するとされています。難しいタスクや長時間の非同期処理には、より多くのトークンを使う「extra」や「max」の選択も可能です。

2つ目はMessages APIの更新で、「会話途中のシステムメッセージ(mid-conversation system messages)」と呼ばれる機能です。Opus 4.8では、ユーザーのターンの直後に role: "system" のメッセージを messages 配列へ挿入できるようになりました(挿入位置にはルールがあります)。これにより、長時間実行されるタスクの途中で、システムプロンプト全体を再送信することなく指示を追加でき、それ以前のターンのプロンプトキャッシュを維持したまま入力コストを抑えられます。エージェントの実行中に権限やトークン予算、環境コンテキストを更新する、といった使い方が想定されています。なお、この機能はOpus 4.8のみで、Opus 4.7以前のモデルは messages 配列内の system ロールを400エラーで拒否します。

安全性とアラインメント

Anthropicはリリース前に詳細なアラインメント評価を実施したとしています。同社のアラインメントチームは、Opus 4.8が「ユーザーの自律性の支援やユーザーの最善の利益に沿った行動といった、向社会的(prosocial)な特性の指標で新たな高水準に達した」と結論づけたと説明しています。また、欺瞞や誤用への協力といったミスアラインメント挙動の発生率は、Opus 4.7より大幅に低く、同社が最もアラインメントが取れているとするモデル「Claude Mythos Preview」と同程度だとしています。これらの評価とデプロイ前の安全テスト一式は、System Cardに報告されています。

次に来るもの:Mythos-classモデル

Anthropicは今後について、Opusと同等の能力をより低コストで提供するモデルを開発中であること、そしてOpusを上回る知能を持つ新しいクラスのモデルをリリースする計画であることを示しています。後者は「Project Glasswing」と呼ばれる取り組みの一環で、現在は少数の組織が「Claude Mythos Preview」をサイバーセキュリティ業務に利用しているとのことです。この水準の能力を持つモデルは、一般提供の前により強固なサイバー面の安全策(safeguards)が必要だとされ、Anthropicはその開発を進めたうえで、Mythos-classモデルを「数週間以内(in the coming weeks)」に全顧客へ提供する見込みだと述べています。

なお、Anthropicは同じ5月28日に、シリーズHで650億ドルを調達し、ポストマネー評価額が9,650億ドルに達したことも発表しています。各種報道では、この評価額がOpenAIの8,520億ドルを上回り、世界で最も価値の高い非公開AI企業になったと伝えられています。

実務の観点から

ITの現場でOpus 4.8をどう捉えるか、いくつかの観点を整理します。

まず、既存のClaudeおよびClaude Codeユーザーは、価格据え置きのまま性能改善の恩恵を受けられます。乗り換えのコスト面のハードルは低いと言えます。

動的ワークフローは、レガシーコードベースの大規模監査や移行など、従来は人手で数週間を要した作業を効率化できる可能性があります。一方で、トークン消費が大きいことをAnthropic自身が警告している以上、いきなり大規模に適用するのではなく、フォルダ単位の監査や十数ファイルの移行といった狭い範囲で消費量を計測してから広げるのが現実的です。プランごとに既定の有効・無効が異なる点も、組織導入の前に確認すべきポイントです。

「正直さ」の改善については、出力を確認する手間が減る可能性がある一方、その根拠がAnthropic自身の評価である点を踏まえ、過信は避けるべきです。とくにコードの自己点検能力が上がったとしても、本番反映前のレビューや、影響範囲の大きい変更に対する人間の確認は引き続き欠かせません。

また、Anthropicが数週間以内にMythos-classモデルの一般提供を予告していることから、大きな移行やツール選定の判断を急ぐ必要はないという見方もできます。Opus 4.8は堅実なアップデートとして受け止めつつ、次の世代の動きも視野に入れておくのが妥当でしょう。


ソース

一次情報・公式情報

参考情報

  • MacRumors / Gizmodo / Thurrott.com / Axios / Help Net Security / 9to5Mac / SD Times / Simon Willison’s Weblog ほか各メディアの報道

コメント

タイトルとURLをコピーしました