12月27日早朝、OpenAIは次のように発表した。チャットボット ChatGPT、ビデオ生成モデル Sora および API で重大なエラーが発生しました。それらのほとんどは数時間にわたってダウンしていましたが、問題は特定され、復旧が始まりました。障害は12月26日東部時間午後1時30分ごろに始まった。ネットワーク状態監視ウェブサイトDowndetectorによると、午後には主にChatGPTに関連した問題を1万5000人以上のユーザーが報告したという。同日夕方までに通報数は700件未満に減った。


OpenAIはすぐに、ChatGPT、API、Soraのエラー率が現在高く、問題の原因は上流のプロバイダーにあるとするレポートを発表した。


画像出典:OpenAI

以前のメディア報道によると、OpenAIは問題に関連する「上流プロバイダー」を特定しなかったが、同社の専属クラウドプロバイダーであるマイクロソフトは、同社のデータセンターの1つで「電力問題」が発生したと報告した。この問題は OpenAI の問題と同時に発生し、北米に影響を及ぼしました。同時に、Xbox クラウド ゲームにも問題がありました。午後5時過ぎ東部時間12月26日、マイクロソフトは影響を受けたデータセンターの「電力を完全に復旧」したと発表した。


この夏の終わりの時点で、ChatGPT の毎日のアクティブ ユーザー数は 2 億人を超えています。 ChatGPT を含む人気の OpenAI 製品はリリース以来、複数回の停止に見舞われています。

最近の大規模障害は、Sora のリリースから数日後の 12 月 11 日に発生しました。 ChatGPT、API、Sora を含む OpenAI のすべてのサービスは、太平洋時間の 12 月 11 日午後 3 時 16 分から午後 7 時 38 分まで、4 時間以上にわたって深刻なパフォーマンス低下、または完全な利用不能に見舞われました。この機能停止は、新しくデプロイされたテレメトリ サービスの構成ミスが原因で、世界中の何百もの Kubernetes クラスタのコントロール プレーンに過負荷がかかり、重要なシステムに連鎖的な障害が発生しました。