メキシコの開発者 (わずか 3 人のチーム) が、高額な請求書について助けを求めて Reddit に投稿しました。この小規模チームは Google Cloud が提供する Google Gemini アクセスを利用していましたが、操作ミスにより API キーが誤ってオンラインに漏洩してしまいました。

通常、この開発者が支払う必要がある Google Gemini の月額料金はわずか 180 米ドルですが、誤ってキーを公開した後、すぐに取得されて他の人に使用され、わずか 48 時間で 82,000 米ドルという高額な請求が発生しました。
問題は、この高額な法案にどう対処するかだ。この小さなチームは料金を支払うことができません。ただし、支払いを怠った場合、Google Gemini の使用を継続できなくなるだけでなく、潜在的な法的問題に直面する可能性もあります。
Google にはこれらの手数料を免除する予定はありません。
この小規模なチームは料金のキャンセルまたは減額を希望して Google に連絡しましたが、Google のサポート エンジニアは Google Cloud の責任共有モデルについて言及しました。簡単に言えば、これは Google の責任ではないため、顧客は請求額を全額支払う必要があります。
通常の観点からすれば、Google の主張には何の問題もありません。結局のところ、鍵の漏洩による高額な請求の原因は開発者自身であり、Google は Google Cloud を通じてリソース サービスを提供していますが、これには当然コストがかかります。
しかし、問題は Google の割り当てメカニズムにあります。
OpenAI API などのほとんどのプラットフォームを使用している場合は、プラットフォームがプリペイド メカニズムを使用していることに気づくでしょう。つまり、ユーザーは使用する前に再チャージする必要があります。残高がなくなり次第、即時サービスを終了させていただきます。
同時に、このプラットフォームは、特定の予期せぬ状況を防ぐための消費制限機能も提供します。たとえば、制限が月あたり 30 ドルに設定されている場合、今月 30 ドルを超えて使用すると、アカウントに残高があってもサービスが停止されます。
ただし、Google Cloud にはこのメカニズムがなく、特に Google Cloud Gemini には割り当て制限がありません。 Google は API リクエストの呼び出しレート制限のみを提供しており、クォータ消費制限は提供しません。
注: ただし、Google Cloud Platform には予算警告機能があります。事前に予算額を設定し、警告をトリガーするしきい値を設定する必要があります。開発者が予算警告機能を受け取ったかどうか (またはまったく設定していないか) は不明です。
開発者が不満を抱いているのは、Google が異常を検出しなかったことです。つまり、通常の月額料金は 180 ドルですが、24 時間以内に突然大量のリクエストが発生しました。 Google は、ユーザーに確認を通知する前に、異常を検出してブロックできる必要があります。
請求額を減額または削減できますか?
Google の観点からすると、責任共有モデルには何の問題もありません。開発者の観点から見ると、Google Cloud の設計上の欠陥とセキュリティ メカニズムも、請求額が高額になる原因となっています。
したがって、開発者が Google とどのように交渉するかにかかっています。いずれにしてもGoogleが免除を放棄する気がないのであればどうすることもできないが、もしかしたらGoogleも今回の事件を通じて独自の仕組みを改善できるかもしれない。結局のところ、Google Cloud API には Gemini だけでなく、はるかに多くの製品が含まれています。
また、他の開発者に、AI モデルまたは他のクラウド製品を呼び出す場合は、プラットフォームにクォータ制限が提供されているかどうかを必ず確認してください。そうでない場合は、キーを公開して高額な請求につながる可能性のある間違いを避けるために、それを使用しないことが最善です。