2026年5月28日、Anthropic が Claude Opus 4.8 をリリースしました。
今回の最大の変化は、派手なスコアの上昇ではありません。「自分の弱点を正直に申告できる AI」への進化です。
Anthropic 自身は今回を「控えめだが確かな前進」と表現しています。劇的なジャンプではなく、実務での信頼性を底上げするアップデートという位置づけです。
ただし、主要なベンチマーク(AI の能力テスト)のスコアを見ると、謙遜しすぎの感があります。GPT-5.5 や Gemini 3.1 Pro との比較では、ほとんどの項目で Claude Opus 4.8 がトップです。
| テスト項目 | Claude Opus 4.8 | Claude Opus 4.7 | GPT-5.5 | Gemini 3.1 Pro |
|---|---|---|---|---|
| エージェント的コーディング(SWE-Bench Pro) | 69.2% 🥇 | 64.3% | 58.6% | 54.2% |
| コーディング総合(SWE-bench Verified) | 88.6% 🥇 | 87.6% | — | 80.6% |
| 多分野横断の推論(Humanity's Last Exam・ツール使用) | 57.9% 🥇 | 54.7% | — | — |
| コンピュータ・ブラウザ操作(Online-Mind2Web) | 83.4% 🥇 | — | 78.7% | — |
| 実務的知識作業(GDPval-AA・max 設定) | 1,890 🥇 | 〜1,753 | 〜1,769 | — |
| ターミナル作業(Terminal-Bench 2.1) | 74.6% | — | 78.2% 🥇 | — |
出典: Anthropic 公式発表 / 各社公開スコア(2026年5月28日時点)。ターミナル作業のみ GPT-5.5 が上回る。
コーディング・推論・コンピュータ操作など、実務に直結する分野ではほぼ全勝。「控えめな前進」という表現は、Anthropic の自社評価の慎重さの表れで、スコアを見れば現時点で最も総合力の高いモデルです。
この記事では、Claude Opus 4.8 の主な新機能を、ビジネスで AI を活用している方にも分かるように整理します。
3つのAIを使い分けて気づいた、Claude の特徴
私は日常的に ChatGPT・Claude・Gemini を目的ごとに使い分けています。AI の競争は激しく、「今月 No.1 のモデル」が翌月には別のモデルに追い抜かれるサイクルが続いています。半年前に感動していたモデルが、今は中堅になっている。それが今の AI 業界の速度感です。
だから1つのAIだけに絞るのではなく、仕事の内容によって使い分けるのが実態です。各 AI には「性格」があり、得意なことが違います。その違いに気づいてから、使い方が大きく変わりました。
その中で Claude をよく使う理由のひとつが、思考のプロセスが見えることです。生成中に思考過程を表示するボタンを押すと、AI が何を考えながら答えを組み立てているかが読めます。これを繰り返し見ていて、ひとつ気づいたことがあります。
Claude の上位モデルは、答えを出す前に「読んでいる人がどう感じるか」「ユーザーの意図は何か」を想定してから生成しているようでした。「この説明で混乱しないか」「この表現は失礼に当たらないか」を先に考えてから、言葉を選んでいる。一言で言えば、Claude は EQ(感情を読む力)が高いです。
今回の「正直さの向上」も、この方向性の延長線上にある変化だと受け取っています。
Claude Opus 4.8 とは何か
まず基本情報を整理します。
| 項目 | 内容 |
|---|---|
| モデル名 | Claude Opus 4.8 |
| リリース日 | 2026年5月28日 |
| 前モデルとの関係 | Opus 4.7 の正常進化版。「より頼れる協働相手」という位置づけ |
| 通常価格(目安) | 入力100万単位あたり5ドル / 出力25ドル(前モデルから据え置き) |
| 利用できる場所 | claude.ai、Claude Code、Claude API |
Anthropic 公式が掲げたキャッチは3点です。
① より鋭い判断力、② 自分の進捗に対する正直さ、③ これまでより長く自律的に作業できる。
今回の目玉は「正直さ」の向上
AI には一般的な弱点があります。根拠が薄いのに「できました」「問題ありません」と自信満々に言ってしまうという傾向です。
Opus 4.8 はここを訓練で改善しました。
- 自分の作業に不確かな点があれば、自分から「ここは怪しい」と申告するようになった
- 根拠のない断言が減った
- 自分が書いたコードの欠陥を見逃す率が、前モデル比でおよそ4分の1に減少(見逃しが約75%減)
- 人間の意図からズレた挙動の発生率が大幅に低下し、これまでで最も整合性の高いモデルに近い水準に到達
「報告をそのまま信用できる」ことが、実務での最大の変化点です。
たとえ話で考えてみてください。
これまでの AI は、「任せた仕事を半分しか終わらせていないのに『全部終わりました!』と自信満々に報告する新人社員」のようなものでした。納品物を上司が一枚ずつ突き合わせて、抜けや矛盾を探さないと、そのままお客様に出してしまう。レビューに毎回フルチェックの時間を取られていました。
Opus 4.8 は、「ここまでは完了しました。ただし、この部分は前提が確認できていないので、念のため目を通してください」と自分から不確実な箇所を申告してくれる新人社員に変わった、というイメージです。上司(あなた)が全件チェックしなくて済む。任せられる仕事の幅と量が、実務で一段増えます。
数百のAI分身が同時に動く「ダイナミックワークフロー」とは
Claude Code(AIを活用したプログラム開発環境)に追加された新機能で、現在は試験公開の段階です。
仕組みを平たく言うと、1回の作業セッションの中で、Claude が数十〜数百の「分身」を同時に走らせて作業を並列処理するという機能です。
- あなたの指示をもとに Claude が自分で作業計画を立てる
- タスクを細かく分割し、多数の分身に並行で割り振る
- それぞれの成果を別の分身が検証・確認してから統合する
- 答えが収束するまで繰り返し、最後に1つの結果にまとめて返す
進捗が随時保存されるため、途中で中断しても最初からやり直しになりません。
Anthropic の公式発表では、実際の活用事例が紹介されています。あるエンジニアがプログラムの言語を移植する大規模作業(75万行規模)に使ったところ、最初の作業からマージ完了まで11日で終わったと報告されています。これは通常なら数か月単位でかかるような作業規模です。
たとえ話をすれば、これまでの Claude は「めちゃくちゃ優秀だが1人で順番に作業する社員」でした。ダイナミックワークフローは、その社員が必要に応じて数百人のチームを即座に編成し、自分が現場監督になって割り振り、別の検査班にダブルチェックさせ、全部まとめて報告書1枚にして提出するようなものです。
なお、この機能は通常のセッションよりも処理量が大幅に増えます。初回起動時は実行内容を確認するステップがあります。
▼ AIを「使う」から「組み込む」へ進めたい方へ
答えの精度とスピードを自分で設定できる「努力度コントロール」
claude.ai に、「Claude がその回答にどれだけ深く考えるか」を選べる設定が追加されました。
- 高い設定:より頻繁に・より深く考えてから答える → 回答の質が上がる
- 低い設定:速く答える → 1時間あたりの使用上限の消費がゆっくりになる
Opus 4.8 は標準で「高い」設定になっています。コーディング作業では前モデルの標準とほぼ同じ処理量で、性能だけが上がる設計です。
たとえ話をすれば、レストランの「お急ぎ仕上げ」か「じっくり仕上げ」を自分で選べるようになった感じです。料理人(Claude)の腕は同じでも、かける手間をこちらが指定できる。 用途ごとにコストとスピードのバランスを自分で握れるのが、今回の新しい点です。
高速モードが3倍安く、2.5倍速になった
Opus 4.8 の高速モードは、通常の2.5倍の速さで動きます。しかも以前の高速モードより3倍安い価格になっています。
| モード | 入力(100万単位) | 出力(100万単位) | 特徴 |
|---|---|---|---|
| 通常 | $5 | $25 | 前モデルから据え置き |
| 高速(Fast mode) | $10 | $50 | 2.5倍速 / 以前の高速モードより3倍安 |
「特急料金が3分の1になって、電車自体も速くなった」ようなイメージです。大量の作業を高速でさばきたい用途(サービスへの組み込みや、大量の分析処理など)で効いてきます。
「最も優秀な人間専門家を超える」と言われる次世代モデル「Mythos」の実態
今回の Opus 4.8 は「現行フラッグシップの改良版」ですが、その上にいる次世代モデル「Mythos」の存在感が、AI 業界を揺るがし始めています。
Mythos は、コーディング・推論・問題解決まで含めたあらゆる分野で Opus を大きく超える、汎用の次世代フロンティアモデルです。 一部のニュースで「セキュリティAI」と紹介されることがありますが、用途を限定したモデルではありません。
その総合能力の一端として、コンピュータのセキュリティ分野でも、世界トップクラスの人間の専門家を超えるレベルで、ソフトウェアの欠陥(脆弱性)を発見できることが分かりました。発見した欠陥は、悪意ある攻撃者に先回りして塞ぐ目的で各社に提供されています。欠陥を悪用するのはあくまで人間の攻撃者側であり、Mythos 自身が攻撃を行うわけではありません。
それでも一般公開が慎重に進められているのは、同じ「欠陥を見つける能力」がそのまま攻撃用途に転用される可能性があるためです。だからこそ Anthropic は、信頼できる企業や研究機関に限定して提供する段階を踏んでいます。
実際に何をしたのか
Anthropic は「Project Glasswing」という取り組みを2026年4月に始めました。AWS・Apple・Google・Microsoft・Cisco など50以上のトップ企業と連携し、このモデルを"攻撃に使われる前に守るため"に先行提供する、という防衛的な取り組みです。
その結果は衝撃的でした。数週間で、主要なすべての OS とほぼすべてのブラウザに潜む1万件以上の高・重大レベルのゼロデイ脆弱性(未発見の欠陥)が発見されました。中には、27年前から存在していた遠隔攻撃可能なバグも含まれていました。
- 発見した重大脆弱性:10,000件以上(2026年5月26日時点)
- 対象:すべての主要 OS・ほぼすべての主要ブラウザ
- あるブラウザのベンチマークでは 181 件の実際に動く攻撃コードを自律生成
- 27年間気づかれなかったバグを含む、数十年単位の見逃しを一掃
言い換えると、もしこのモデルが悪用される側に渡っていたら、インターネット基盤そのものが脅威にさらされていた可能性があります。
日本政府・国会も動いている
このような強力な AI の登場を受け、日本でも法制度の整備が進んでいます。
- AI 法(人工知能関連技術の研究開発及び活用の推進に関する法律)が2025年9月に全面施行。国が事業者に対して指導・助言を行える仕組みを整備。
- 2025年12月23日、政府は「人工知能基本計画」を閣議決定。「信頼できる AI を世界とともに創り上げる」を目標として掲げた。
- 2026年通常国会では、AI 活用を念頭に置いた個人情報保護法の改正案が提出される予定。
「ChatGPT が登場した」「Claude が使えるようになった」という次元の話ではありません。コンピュータのセキュリティの仕組みそのものを、AIが自律的に書き換えられる時代が来たことを、世界中の政府とテクノロジー企業が認識し始めています。
今後の提供拡大については、Anthropic は「数週間のうちに(in the coming weeks)より多くの顧客へ提供できる見込み」と表明しています。確約ではなく見込みですが、一般公開に向けた準備が急ピッチで進んでいます。
まとめ|「優秀な人」から「信頼して任せられる協働者」へ
Claude Opus 4.8 の主な変化点を整理します。
- 正直さの向上:コードの欠陥見逃しが前モデル比で約75%減。報告をそのまま信用できる
- ダイナミックワークフロー:数百のAI分身が並列で動き、大規模な作業を一気通貫でこなす(Claude Code・試験公開中)
- 努力度コントロール:精度とスピードのバランスを用途で切り替えられる
- 高速モードの値下げ:2.5倍速で以前より3倍安い
- 価格据え置き:通常モードは Opus 4.7 と同じ価格で性能が向上
今の Claude は「何でもできる優秀な人」から「信頼して任せられる協働者」へと変わりつつあります。
参考にした公式情報はこちらです。
- Introducing Claude Opus 4.8(Anthropic 公式発表)
- Introducing dynamic workflows in Claude Code(Claude 公式ブログ)
▼ AIをチームのように使いこなしたい方へ
興味がある方へ|AIと一緒に成長し続けるために
「Claude 4.8 の機能はわかった。でも、自分のビジネスにどう活かすかは、正直まだピンと来ていない」。
これは当たり前のことです。AI の進化スピードは、片手間で追いかけられる速さをとっくに超えています。新機能が出るたびに調べ直し、業務にどう落とすかを一人で組み立て続けるのは、もう個人の根性で解決できる領域ではありません。
道具だけを最新にしても、使いこなす仕組みがなければ売上は1円も動きません。
本当に必要なのは、ツールの知識ではなく、あなたのビジネス専用に組まれた仕組みと、一緒に走る伴走者です。
- Claude 4.8 のような最新AIを「自分の業務」に落とし込みたい
- AIのアップデートを追うのに疲れた。代わりに考えてくれる人が欲しい
- ツールを入れるだけで終わらせず、収益が動く仕組みごと作りたい
こういう方のために、Ailly では初回限定のキックオフ・コンサル(2時間・オンライン)を用意しています。
このコンサルで売り込みは一切しません。やるのはひとつだけ。あなたの仕事の現状を一緒に解きほぐして、「どこからAIを入れたら、一番早く・一番大きく効くか」をその場で見つけること。
2時間後、あなたの手元には「次の一手」がはっきり残ります。
そのアイデアだけ持ち帰って自分で実装しても構いません。続きを一緒にやりたくなったら、そのとき改めて相談してください。
枠は毎月限定です。先に動いた人から、AIで利益が動く仕組みを手に入れていきます。



