北京時間7月1日、米国のヘッドモデルメーカーAnthropicは、新世代のミッドレンジ主力モデルClaude Sonnet 5を発売した。同時に同関係者は、米国商務省から同社の最上位フラッグシップモデルClaude Fable 5とMythos 5に対する制限を正式に解除する通知を受け取り、明日から全世界へのアクセスを完全に回復することを認めた。
しかし、Anthropic は、新しいモデルがすべての人に公開されているのか、それとも認証されたユーザー/市民のみに公開されているのかというネチズンからの質問には直接回答しませんでした。以前、当局者らは、Anthropicが米国政府と緊密に連携しており、6月27日に一部の米国の作戦および防衛重要インフラ組織にMythos5を導入したことを明らかにしていた。
Sonnet 5 の発売により、Anthropic の第 5 世代モデル システムが完成しました。製品シリーズでは、Sonnet 5 は軽量の Haiku 5 とハイエンドのフラッグシップ Opus 4.8 (および Fable 5) の間に位置します。テスト データによると、コア エージェント プログラミング機能の点で、Sonnet 5 は 63.2% のスコアを記録し、前世代の Sonnet 4.6 (58.1%) より 5.1 ポイント高く、最上位のフラッグシップである Opus 4.8 (69.2%) との差は 6% 未満に縮まりました。

公式のテクノロジー位置付けレイアウトでは、Sonnet 5 ロングボードは、複雑なコード生成、長い文書の詳細な分析、複数ステップの自動化、および「コンピューター制御」の強力な実装 (ブラウザー、端末、および GUI の独立した引き継ぎを含む) に焦点を当てています。新しいモデルには、独立して長期計画を策定し、ツール間での呼び出しを調整する機能があります。手動介入なしで長期間独立して実行できるため、長期的なタスクを実行する現在の開発者コミュニティのニーズを満たします。
エージェントとランディング アプリケーションの機能は、Anthropic と OpenAI との主要な競争の焦点でもあります。 OpenAI の商用データと公開前の収益レッドラインと競合するために、Anthropic は Sonnet 5 に新しい単語セグメンター (Tokenizer) を採用しました。これにより、根本的な精度が向上すると同時に、同じテキスト入力で以前より 1.0 ~ 1.35 倍多くのトークンが消費されます。
トークナイザーの再構築によって引き起こされる総ユーザーコスト (TCO) のリバウンドを防ぐために、Anthropic は段階的な価格プロモーションを開始しました。8 月 31 日までのプロモーション期間中、API の 100 万トークンあたりの基本価格は、入力の場合は 2 米ドル、出力の場合は 10 米ドルに引き下げられます。しかし、9 月 1 日からは通常の請求額 (入力に対して 3 米ドル、出力に対して 15 米ドル) に戻ります。開発者グループは、実際のトークン消費基盤の拡大により、プロモーション期間後の実際の通話料金は必然的に過去のバージョンよりも高くなるだろうと考えています。
この経営判断の背景には、Anthropic が直面する IPO 前の財務的プレッシャーがあります。ウォール街が最先端の AI 研究所を評価する際、もはやユーザー数 (MAU) だけを考慮するのではなく、ARPU (ユーザーあたりの平均収益) と粗利益率の監査に重点を置くようになっています。高価で通話量が限られているトップフラッグシップの Opus と比較すると、ローエンドの Haiku の利益はわずかです。ミッドレンジの Sonnet システムは、ほとんどの複雑なサービスを処理できるため、会社のコア ビジネス フロー レートが向上します。
Fable 5 と Mythos 5 が以前に制限されていた時期に、世界の AI 市場のウィンドウピリオドが中国メーカーに向けて加速していたことは注目に値します。この時期、中国の大手モデル会社である Zhipu が発売した GLM-5.2 は、その費用対効果の高さから、海外のオープンソースおよび開発者コミュニティで広範な議論を引き起こしました。海外の開発者は多様化した技術スタックに依存する傾向を示しており、世界的なエージェント進化の波の中で中国の大型モデルはより強力な代替柔軟性を示しています。