Anthropic は、Claude Fable 5 と Claude Mythos 5 を正式にリリースしました。前者は一般ユーザーに公開されていますが、後者は引き続き「信頼できるセキュリティ パートナー」に制限されています。新型モデルのネーミングは、クロードの一貫したスタイルに沿ったものと言える。

Haiku (俳句) から Sonnet (ソネット)、Opus (芸術的傑作) まで、Anthropic は文学的および芸術的な概念をモデルに重ねてきました。ミトスによって、その名前は文学作品から「神話」そのものにまで広がりました。
寓話は、「語られるもの」を意味するラテン語のファブラに由来しており、ギリシャ神話と同じ起源を持っています。直訳すると一般に「寓話」と呼ばれます。その名称は、まさに新型モデルの「ミトス級」モデル、「開かれた神話」という位置づけのようだ。
Anthropic の説明によると、Fable 5 と Mythos 5 は同じ基礎モデルを共有していますが、一般配布により適した安全なシェルにパックされています。公式モデルの能力という点では両者は同じ位置に位置します。

しかし、スコアはスコアであり、Fable と Mythos がまったく同じパフォーマンスを発揮するのであれば、2 つの名前に分ける必要はないと思います。
書き換えられた「神話」
神話は書き換えられ、圧縮され、戒められ、寓話となった。
公式ドキュメントによると、Fable 5 は公開バージョンです。これは一般のユーザーと開発者に公開されていますが、ネットワーク セキュリティ、生物学、化学、モデルの蒸留などの高リスク領域では、追加のセキュリティ分類子が関係します。リクエストにこれらの機密性の高い指示が含まれる可能性があるとシステムが判断すると、回答は Fable 5 に続行されず、自動的に Claude Opus 4.8 に戻ります。
Mythos 5 は同じ基礎モデルに基づいていますが、いくつかの領域で Fable 5 のガードレールを解除しています。 Anthropic は、Project Glasswing のネットワーク セキュリティ パートナーは Mythos 5 の「フル バージョン」を使用できると述べました。将来的には、一部のライフサイエンス研究者が、Trusted Access Program を通じて生物学的および化学的制限を削除したバージョンを使用する可能性もあります。
今は未使用の神話については触れませんが、最初にいくつかの実用的なものを見てみましょう。
1つ目は価格設定です。一言で言えば、高価です。
Fable 5 の価格は、入力の場合は 100 万トークンあたり 10 ドル、出力の場合は 100 万トークンあたり 50 ドルです。開発者は、Claude API を通じて claude-fable-5 (モデル名) を呼び出すことができるようになりました。
この価格はOpus 4.8のちょうど2倍で、Opus 4.8の高速モードと同じです。 Anthropic は明らかに Opus よりも高い価格帯に置いています。
ただし、Anthropic 氏は、この価格は以前の Claude Mythos Preview の半額以下であると述べていますが、Mythos Preview はパブリック API モデルではないため、公式は一般向けの標準価格を提示しておらず、この文は検証できません。
サブスクライバーは、Fable 5 が長期間にわたって基本サブスクリプション パッケージに直接含まれない可能性があることにも注意する必要があります。
Anthropic は公式説明文の中で、6 月 23 日以降、ユーザーが Claude を購読している場合でも、Fable 5 はコンピューティング能力に基づいてボリュームベースで提供され、基本サブスクリプションサービスに直接含まれない可能性があると述べています。
この会社はどんどんケチになってきているが、少なくとも半月は試用期間がある。同関係者はまた、ある程度の余地を残しており、6月23日以降もコンピューティング能力リソースが十分であれば、AnthropicはPro、Max、その他のサブスクリプションサービスに引き続きFable 5を含めるように努める予定だという。

価格が高いこと自体は理解するのが難しいことではありませんが、その機能が価格に見合ったものであることを確認することが最善です。
ランニングスコアから判断すると、Fable 5/Mythos 5 は基本的に Anthropic の現時点で最も強いものです。
ただし、公式の表には、Claude Fable 5 と Claude Mythos 5 のスコアの差は通常 1 ~ 3 パーセント ポイントしかないという注記があります (アスタリスク付きのネットワーク セキュリティとバイオ関連のテストを除く)。そのため、表では 2 つのスコアの高い方を示しています。これについて文句を言わずに済むのは難しい。

Anthropic は、ソフトウェア エンジニアリング、ナレッジ ワーク、ビジョン、長期コンテキスト記憶、生命科学研究など、いくつかの方向に Fable 5 を焦点を当てています。
ソフトウェア エンジニアリングは、最も顕著なシナリオの 1 つです。表によると、Fable/Mythos 5 は SWE-Bench Pro で 80.3% に達し、Opus 4.8 の 69.2% よりも大幅に高くなっています。より難しい FrontierCode Diamond では 29.3% を獲得しましたが、Opus 4.8 では 13.4% のみ、GPT-5.5 では 5.7% しかありませんでした。


知識作業と視覚的作業に関して、Anthropic は 2 種類の証拠を提供します。
1 つのタイプは標準化されたベンチマークです。公式テーブルによると、Fable/Mythos 5 の GDPval-AA スコアは 1932 で、Opus 4.8、GPT-5.5、Gemini 3.1 Pro よりも高かったです。視覚的に理解できる GDP.pdf ドキュメント タスクでは、29.8% に達し、他の主要モデルも上回りました。
もう 1 つのカテゴリは、初期の顧客テストです。 Anthropic 氏は、Fable 5 は Hebbia の高度な財務推論ベンチマークで最高スコアを達成し、その利点は文書推論、図表の理解、問題解決に焦点を当てていると述べました。 IMCはまた、取引分析評価にほぼ完全に合格したと報告した。
Fable 5 のビジュアル機能を実証するために、Anthropic 氏は例を挙げました。以前は、クロード モデルでは「ポケモン: ファイアレッド」をプレイするために複雑な補助ツールが必要でしたが、Fable 5 では視覚的な入力だけでレベルを完了できます。

長期的なタスクと記憶能力に関して、Anthropic 氏は、Fable 5 は数百万のトークンを使用して長期的なタスクに集中し続けることができ、独自のメモを使用して出力を向上させることができると述べました。
「Slay the Spire」のような継続的な意思決定と長期的な戦略が必要なゲームでは、Fable 5 が永続的なファイル メモリに接続され、以前の選択や経験を記録できる場合、パフォーマンスが大幅に向上します。 Opus 4.8 の 3 倍に向上し、最終レベルに到達できる回数も 3 倍に増加します。
ちなみに、Fable は古典的な RPG ゲームの名前でもあり、中国語では「寓話」と訳されます。おそらくいつか、寓話が「寓話」をプレイする姿が見られるかもしれません。
さらに、ネットワーク セキュリティ機能の点で、Fable/Mythos 5 は ExploitBench Cap% で 78.0% に達し、Claude Mythos Preview の 69.0% を上回り、Opus 4.8 の 2 倍近くに達しました。
Fable 5 は高リスクのリクエストでは Opus 4.8 にフォールバックするため、ここでは Mythos 5 のスコアを使用する必要があります。
強力なモデルは階層化する必要がある
今回、Anthropic は、モデルの機能の視覚的な表示を「ポートフォリオ」に似たスライド ページに組み込み、各デモに対してコメントの短い段落のみを提供しました。

たとえば、Fable 5 は、物理学の第一原理から惑星の軌道運動を推定し、それを日食の予測に使用する太陽系シミュレーションを作成しました。

別の例としては、「Factory」を単独でプレイすることができます。エンジニアが大好きなファクトリーオートメーションゲームです。プレイヤーは資源を収集し、生産ラインを計画し、物流とエネルギー システムを構築する必要があります。
アントロピックはこの例を使用して、フェイブル 5 がオープンな環境で戦略を策定し、複雑なシステムの構築を促進し続けることができることを説明しました。

別のデモでは、Fable 5 が最初にブラウザベースの CAD エディタを作成し、次にこの自社開発の CAD ツールを使用して 3D プリントできる完全なモデルを設計しました。このエディタには、モデリングを支援する AI コパイロットも組み込まれています。
このデモの焦点は、Fable 5 が閉ループを完了することです。最初にツールを作成し、次にツールを使用し、最後に物理設計タスクを完了します。

最後のデモでは、Anthropic が、クラシック音楽の EDM リミックスと同期したモーション リズムを備えた、Fable 5 によって書かれた流体シミュレーションを披露しました。公式はまた、音楽もコードを使用してFable 5によって生成されていることにも具体的に言及しました。

これらの例は派手に見えますが、アイデアは同じです。Fable 5 は、コード、ビジョン、物理学、デザイン、長期計画をタスクに組み込むことに優れています。
このパートが開発者の手で Fable 5 ができることを示すとすれば、次のパートでは、Mythos 5 が研究者の手で何ができるのか、そしてなぜ Anthropic が Fable と Mythos を分離したいのかについて説明します。
Anthropic 社は、社内のタンパク質設計専門家による評価で、Mythos 5 は医薬品設計プロセスのいくつかの側面を約 10 倍高速化したと述べました。あるケースでは、Mythos 5 は人間の助けなしでタンパク質設計およびバイオインフォマティクス ツールに接続され、熟練した人間のオペレーターと同等かそれを上回りました。
このタスクでは、Mythos 5 は単に質問に答えるだけでなく、結合部位の選択、タンパク質設計ツールの選択と実行、失敗後の自己回復など、科学的ワークフローの完全なセットを完了します。当局者らは、今回の研究で対象としたタンパク質14個のうち、9個で強力な候補分子が生成され、現在さらなる研究が行われていると述べた。

Anthropic 氏は、Mythos 5 が斬新で魅力的な分子生物学の仮説を着実に提案できることにも言及しました。 Opus レベルのモデルとのブラインド テスト比較では、社内の科学者は約 80% の確率で Mythos によって提案された仮説を好んでおり、その一部は実験的に評価されています。
一方、大腸菌タンパク質の新しいメカニズムに関する Mythos 5 の仮説の 1 つは、同じ問題を独立して研究している別の研究室による研究で確認されました。
ゲノミクス研究も行った。
アンスロピック氏によると、ミトス5はわずか1週間余りでほぼ自律的に新しいゲノミクス研究を完了したという。 138 の動物種にわたる数百万の細胞からの単一細胞データを整理し、異なる種で同じ役割を果たす細胞を識別するためのカスタム機械学習モデルを設計およびトレーニングしました。
さらに誇張されているのは、Mythos 5 によってトレーニングされたモデルのパフォーマンスは、最近 Science 誌に掲載されたモデルのパフォーマンスを上回っていると Anthropic が主張していることです。ただし、その規模は後者のわずか 1% に過ぎません。 Anthropic は、これらの結果を今後数か月以内に発表する予定だと述べた。
もちろん、この部分は論文と外部のレビューを待つ必要があります。しかし、Anthropic が提供する公式情報だけを見ると、ライフ サイエンスにおける Mythos 5 の機能は科学研究エージェントの機能に近いものです。質問を読み取り、ツールを使用し、データを処理し、モデルをトレーニングし、仮説を提案し、発表できるところまで研究を進めることができます。
モデルが薬剤設計、ウイルスベクター、タンパク質設計、ゲノミクス研究のタスクを真に前進させることができれば、当然のことながら二重の用途を持つことになります。
生命科学部分はフェイブル5の通常の機能実証ではなく、ミトス5の能力の上限の実証であると考えられる。
しかし、これは、Anthropic が管理する基礎となるモデルが非常に強力であるため、信頼できるアクセスを通じて配布する必要があることを示しています。
興味深いことに、過去のモデル リリースは、パラメータ、実行スコア、価格、コンテキストの長さ、API 名などの技術的な製品に近いものでした。強いのは強い、解放は解放。
しかし、ここミトスでは、事態は複雑になり始めます。同じ基礎モデルが 2 つのバージョンに分割されます。一般ユーザーは Fable 5 を入手しますが、セキュリティ研究者と一部のライフ サイエンス研究者は Mythos 5 を入手します。前者はより厳格なガードレールに設置され、後者は信頼されたアクセスが必要です。
モデルの機能は、高低だけでなく、権限、シナリオ、責任によっても区別されるようになりました。
これは、ある意味、最先端モデルの商品化が新たな段階に入ったことの表れとも言える。強力なモデルほど、すべての人に直接投げられる可能性は低くなる。これらはさまざまなバージョンに分割され、さまざまなセキュリティ境界内に置かれ、さまざまなタイプのユーザーに提供されます。
Anthropic が最初にこれを行ったのは、彼らのモデルが「完全に開示するには強すぎる」ためでした。将来的には、ストーリーを伝え、自社のモデルが強力であることを証明したい他の企業も、このアプローチに従う可能性があります。