Anthropic は、同社の主力モデルである Claude Opus 4.6 および Sonnet 4.6 の 100 万トークン コンテキスト ウィンドウが正式に完全にオープンし、追加のロング コンテキスト プレミアムなしで、Claude プラットフォームの標準価格で請求されることを発表しました。新しい価格システムでは、Opus 4.6 は 100 万トークンあたり 5 ドルのインプットと 25 ドルのアウトプットを維持しますが、Sonnet 4.6 は 100 万トークンあたり 3 ドルのインプットと 15 ドルのアウトプットを維持します。 900,000トークンのリクエストであっても、トークン単価は9,000トークンのリクエストと全く同じです。


この包括的なオープンにおいて、Anthropic はそのロング コンテキスト機能とユーザー エクスペリエンスを体系的にアップグレードしました。まず、1M ウィンドウをサポートするすべてのリクエストには、通常のリクエストと同じレート制限が適用されます。開発者は、同時実行性が高いシナリオや長い会話のシナリオで追加のトラフィック分割やダウングレード戦略を実装する必要はありません。次に、公式は、200,000 トークンを超えるコンテキストにアクセスするときに以前必要とされていたベータ タグ ヘッダーをキャンセルしました。 200,000 トークンを超えるリクエストを直接呼び出せるようになりました。まだベータ ヘッダーを送信している既存のアプリケーションは、コードを変更せずにスムーズに移行できます。
メディア処理機能も、このアップグレードの焦点の 1 つです。 Claude が 1 回のリクエストで受信できる画像または PDF ページの数が 100 から 600 に増加し、コード レビュー、法的文書、科学研究論文、運用および保守ログなどの複雑なマルチモーダル シナリオをカバーし、Claude プラットフォーム、Microsoft Azure Foundry、Google Cloud Vertex AI およびその他のチャネルで同時に開始されました。 Anthropic 氏は、この調整の目的は、開発者が頻繁な分割や圧縮を必要とせずに、数百ページの資料を一度にコンテキスト化できるようにすることで、エンジニアリングの複雑さと情報損失を軽減することであると述べました。
企業およびプロフェッショナルのシナリオでは、1M コンテキストの影響が特に顕著です。当局者らは、長い文脈は「覚えてうまく使える」場合にのみ意味があると強調しており、そのため、Opus 4.6 と Sonnet 4.6 では、長距離記憶と推論能力のために特別な最適化が行われています。サードパーティのベンチマークでは、Opus 4.6 は MRCR v2 で 78.3% のスコアを達成し、Sonnet 4.6 は GraphWalks BFS (100 万トークン) で 68.4% のスコアを達成し、同じコンテキスト長の最先端モデルの中でトップでした。
これは、開発者が、複雑な「ウィンドウ スライディング」や「複数ラウンドの要約」、または履歴コンテキストの頻繁なクリーニングに頼ることなく、完全なコード リポジトリ、数万ページの契約テキスト、またはツール呼び出しトレース、観察記録、および長期実行エージェントの中間推論プロセスを単一のセッションにロードできることを意味します。複数のパートナーは引用文の中で、1M コンテキストにより、詳細を失わずにエージェントを何時間も実行できるため、圧縮による重要な情報の損失が軽減されるだけでなく、複数回のデバッグ、コードレビュー、大規模な運用と保守の分析で繰り返される補足や説明のコストも削減されると指摘しています。
コード開発の分野では、Opus 4.6 の 1M ウィンドウは Claude Code 製品ラインに完全に統合されており、追加の構成を行わなくてもデフォルトで Max、Team、Enterprise ユーザーが利用できます。開発者らは、コンテキストを 200,000 から 500,000、さらには 100 万トークンに拡張した後、エージェントは大規模なコード変更やファイル間の依存関係を処理する際に、より少ない総トークン消費量でタスクを完了できるようになり、コンテキストの分割によって発生する余分なラウンドや繰り返しのリクエストを削減できると報告しました。
運用チームとセキュリティ チームも、ロングコンテキスト機能の直接の受益者とみなされます。大規模な生産システムと複雑なアラーム イベントに直面したエンジニアは、すべてのエンティティ、信号、トラブルシューティングの仮説を 1 つのセッションに保持し、最初のアラームから問題の軽減までの情報の完全なリンクを維持できます。パートナーらは、1M コンテキストを使用すると、大規模なログ、監視データ、およびマルチソース システム ステータスを処理するときに頻繁に「メモリを圧縮」する必要がなくなり、微妙な異常を見逃すリスクが大幅に軽減されると述べています。
法律事務所、科学研究機関、データ集約型企業にとって、長いコンテキスト ウィンドウは新しい知識処理パラダイムを提供します。法務担当者は、数百ページにわたる契約書の複数バージョンを一度に導入して、複数ラウンドの交渉における変更を完全にレビューできます。科学研究チームは、何百もの論文、数式、シミュレーション コードを 1 つの推論プロセスに同時に組み込んで、文書とモデルにわたる包括的な分析を構築できます。一部の協力機関は、この「単一統合」機能により、基礎研究と応用研究の反復ペースが大幅に加速されていると述べています。
アクセスチャネルに関しては、1M コンテキストはクロードのネイティブプラットフォームで有効化され、Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry などのクラウドサービスを通じて提供され、企業と開発者に同時に公開されています。 Anthropic は、統合コストと展開戦略のチームの評価を容易にするために、対応する技術ドキュメントと価格ページを提供し、1M ウィンドウをサポートする現在のすべてのリクエストは引き続き既存の請求標準を使用することを強調します。
Anthropic 氏は、1M コンテキストが完全に利用可能な段階に入ると、チームは長期的な推論の安定性、クロスモーダルの理解、エンタープライズレベルの統合機能について繰り返し検討し、ユーザーが「入力長に関するエンジニアリングのトレードオフの決定」から「ビジネス問題自体を中心としたエージェントの設計」に移行できるようにしたいと述べました。開発者と企業ユーザーは、Claude プラットフォームと主要なクラウド パートナーを通じてこの機能をすぐに有効にし、既存のアプリケーションをロング コンテキスト時代にスムーズにアップグレードできます。