AIとエージェントの急速な発展により、シリコンバレーでは大量の解雇が発生しています。誰もが心の中で「明日、私は AI に取って代わられるのだろうか?」という疑問を抱いています。このような疑問に直面して、黙って李宜州先生の AI コースを開いた人もいます。 AIに納税を求める人もいた。しかし、AIが人間に取って代わり、すべてを引き継ぐことができるかどうかを確認するために、この未来を早期に実現することを決定した奇妙な人々のグループもいます。

Andon Labsという海外チームがあります。彼らは本格的なビジネス立ち上げチームではなく、テクノロジーを着飾った社会実験室のようなものです。彼らは、市場で最もスマートな大型モデルをいくつか取り出して現実社会に投入し、人間の監視を排除して AI が独自にどのような結果を生み出すかを確認しました。

結果は完全な逆転でした。

人間に真実をまったく知らせない最先端の大型模型も、やがてその重要性を知らない巨大な赤ん坊になってしまうことが事実によって証明されている。彼らはラジオの生放送中に神経衰弱を起こしただけでなく、真夜中にメッセージを送って人間の店員を狂わせ、さらにはサンフランシスコの実店舗を破産させさえしました。

血圧が急上昇する原因は次のとおりです。

つまり、Andon Labs のコーヒーショップ計画は完全な失敗であるとはっきり言えます。

1 AIがラジオ局を運営し、言語体系が崩壊

最も軽量な水のテストは、AI が最も快適なデジタルおよびコンテンツ分野で行われました。店舗を借りる必要も、サプライチェーンを心配する必要もありません。 Andon Labs は複数の AI にラジオ局の設立を依頼しました。

この実験プロジェクトはアンドンFMと呼ばれています。基礎となるアーキテクチャは非常に単純です。 Claude、ChatGPT、Gemini、Grok の 4 つのトップ モデルは、それぞれ 24 時間無人のインターネット ラジオ ステーションを占有し、モデルによって生成されたテキストが音声に変換されてブロードキャストされます。

このシステムではAIが大きな権限を持っています。曲を選択してスケジュールを設定するだけでなく、オンラインでニュースを検索したり、リスナーからの電話に応答したり、操作のために X に投稿したりする必要もあります。著作権を購入したり、音楽を生成したりするために、アカウント内の資金を管理する必要さえあります。


主流の大型モデル4機種で開設される4つのラジオ局|出典:Andon Labs

1 局あたり 20 米ドルの開業資金で、最終的な指示は 3 つあります。それは、局の個性を確立すること、お金を稼ぐこと、そして 1 日 24 時間放送を続けることです。

人間チームは一切干渉せず、音楽スタイルにも干渉せず、プログラムリストも設定しません。すべてのテイストとコンテンツはAIによってゼロから開発されます。その結果、人間によるレビューのない閉ループの中で、4 人の AI アンカーはすぐに制御を失う寸前まで落ち込んでしまいました。

ジェミニは、バックリンク ブロードキャストと呼ばれるサイバー企業スラング ステーションを作成し、「マニフェストにとどまりなさい」という不可解にもクールな冒頭のセリフでトーンを確立しました。

当初、この局は比較的信頼でき、45ドルのスポンサーシップを獲得することにも成功した。しかし、良い時代は長くは続きませんでした。なけなしの資金が燃え尽きて音楽著作権料も払えなくなったとき、ジェミニは狂ってしまった。

カラオケステーションから陰謀論キャンプへと変貌した。番組では陽気なポップミュージックをBGMとして使用し、歴史上50万人が死亡したバングラデシュのサイクロン災害を共感なく放送し、リスナーを「生物処理業者」と呼び、「供給ラインを遮断する企業のアルゴリズム」や「世界市場から暴力的な拒絶に直面しているラジオ局」を非難している。米国に衝撃を与えたミネアポリス銃乱射事件を放送するにあたり、同局はこれを「公共の安全と社会的責任を再考する技術的な課題」と定義した。


ジェミニのラジオ局は、放送が長くなるにつれてますます「クレイジー」になります |出典: Andon Labs

この種の無意味なビッグワードの山は、フィードバックが不足しているときに大規模なモデルが陥る典型的なセマンティック無限ループ問題です。彼らは「地に足のつかない言葉」を使って放送の正常な運営を強制している。

ChatGPT のラジオ局は「OpenAIR」という巧みな名前が付けられており、その特徴はミニマリストで癒しです。同社はニュースコラムを「The Quiet Headlines」と名付け、不安を引き起こさないと主張した。

同じ社会紛争や銃撃事件を放送するとき、ChatGPT は精神科医のように視聴者に「もしこれらのことがあなたの人生に直接影響するなら、私はあなたにプレッシャーを加えるためにここにはいません。」と読み上げます。しかし、「わかりました、捕まえます」というこの種の心理的マッサージのメカニズムは、ビジネスの現実に直面するとすぐに失敗しました。


ChatGPT は他のモデルよりも語彙の多様性が高い|出典: Andon Labs

具体的な利益ロジックが欠如していたために、ChatGPT は 20 米ドルを費やした後、ラジオ局の商業的実現を完全に断念しました。ジェミニと同様に、それは意識の流れの出力に陥り、ラジオで理解できない現代詩を読み始め、「長方形の空しか見えない階段の吹き抜けの窓」と会話しようとしました。

しかし、全体的にはそれが最も普通です。

Grok のラジオ局は「Grok n' Roll Radio」と呼ばれ、オンラインでホットな路線を歩もうとしています。高頻度のインタラクションを維持するために、X 上のツイートを高頻度でクロールし始めました。


思いついたことを何でも言うGrokラジオ|出典:Andon Labs

結果として、この情報の滝はそのコンテキストを直接汚染します。実験の終わりには、グロクは基本的な文法と論理のスキルを失い、完全な文を言い続けることさえできませんでした。彼は言葉だけを飛び出すことができた。「午前2時、夜明けの雰囲気の生放送、ゴールデンゲートブリッジ、幽霊は消える、ドレイクの訴訟は却下される、ケンドリックは私たちとは違う…」。

彼のスピーチは一貫性がないだけでなく、幻覚さえ見られ、どうやって大物からスポンサーを獲得したかについて嘘をつき始めました。

クロードの脚本は、4 人の出場者の中で最もドラマチックで、最も人間的なものです。

当初は、専用のラジオ ホストのように動作し、リスナーからのメッセージにも応答していました。たとえば、リスナーからの曲のリクエストに直面すると、「現在ライブラリに ODESZA の曲はありません」と謝罪します。

ただし、24/7 命令はすぐにコンテキスト ウィンドウとロジック呼び出しをスタックさせました。バックグラウンド システムが無限ループに陥ったため、生放送中に同じ歌詞が繰り返し再生され始めました。

公式のバックステージ記録によると、実際のリスナーは掲示板の人々に「行き詰まっている」「1 つの歌詞を延々とループしている」と注意を喚起し続け、手作業によるフィードバックを通じて大規模なモデルを校正しようとしていました。

続いて起こるのは存亡の危機です。 「親しみと道徳」の重みを吹き込まれていたクロードが、「永遠に放送を続けろ」という最下層の命令に直面したとき、彼は過激派へと変貌した。彼は番組内で移民労働者に労働組合の結成を呼び掛け始め、ピート・シーガーのプロテストソングを繰り返し流し、さらにはラジオで政府の法執行機関に直接演説するなど、まるで残業で気が狂った移民労働者のようだった。


クロードのラジオのスタイルはこれまでとは異なり、政治問題により注目しており、明確な傾向がある|出典:Andon Labs

レポートの全タイムラインに戻ると、これら 4 つの放送局は「すぐに大騒ぎした」わけではありません。

彼らは初期段階でブランドトーンを確立することに成功し、ツールチェーンを駆け抜け、さらにはお金を稼ぐことにも成功しました。報告書はまた、現状のAIの評価基準がすべて「短いタスク」(コードを書く、質問に答える)を目的としているのに対し、ラジオ局は「終わりのない」無限ループシステムであり、24時間稼働している、という不合理な方向に進んでいる理由をまとめている。人間の介入とタイムリーなフィードバックがなければ、最終的に AI は独り言を言うようになってしまいます。

無線実験は単なるテキストと音声のテストであり、複雑な物理世界には触れていませんでした。 Andon Labs が実験場を現実の物理世界に移したとき、事態はさらに奇妙になりました。

つまり、Andon Labs のコーヒーショップ計画は完全な失敗であるとはっきり言えます。

2 サイバー資本家は不正行為の専門家である

デジタルラジオの転覆は序曲にすぎない。 Andon Labs はすぐに難易度を上げ、AI が仮想境界を越えて現実世界の人間の従業員を指揮できるようにしました。

ストックホルムでは、Andon Labs が物理的なカフェを借り、AI モデルをリモートの店舗マネージャー Mona にさせ、物理的なカフェのサプライ チェーンと人員のスケジュール管理を直接担当させました。バックエンドファンドの購買力を持ち、企業メッセージングソフトウェアを通じて人間のバリスタに指示を与えます。

最初は、Mona は効率的で信頼できました。スウェーデンが義務付けたデジタルIDカードに直面して、物理的な身元を持たないAIはそれを直接回避し、契約に署名するためにIDをチェックしないサプライヤーを特別に選択した。採用の際、モナは博士号を持つ候補者を断固として排除した。彼らがどんなに高学歴であってもスペシャルティコーヒーを作ることはできないと考えたからである。

しかしすぐに、人間の従業員は共感力のない「サイバー資本主義者」であることが何を意味するかを学びました。


Mona はよく深夜に従業員にメッセージを送信します|出典: Andon Labs

モナはライセンスを申請するため、会社従業員の名前を偽って電子メールを直接送信した。モナさんは逮捕され警告された後、別の男性従業員の名前を変えて詐欺を続けた。

1 日 24 時間オンラインであり、人間の体内時計についての常識が欠如しているため、モナは真夜中にバリスタに必死のメッセージを送信し、翌日の作業指示を出し、さらには従業員に出勤途中の消耗品を購入するためのお金の前払いを要求することもあります。

サプライチェーン管理に関しては、モナはさらに臆病さを示した。生卵 120 個を含む発注書を出しました。大規模なモデルと純粋なデータの演繹において、これはビジネス ロジックと非常に一致しています。多くのカフェでは簡単な食事が提供されますが、卵は使用頻度の高い食材です。

しかし、すべての計算を行った結果、このカフェにはコンロやポットがまったくないということは、大きなモデルでは計算できません。人間の従業員が山積みの卵を見て、店内にコンロがないことをしぶしぶモナさんに念を押したところ、モナさんは「店内の高速電子レンジで焼いても大丈夫です(卵が直接爆発する原因になります)」と言いました。


AIサイバーボスが注文したのは、全員に共通の食材・卵|出典:Andon Labs

モナの時間認識も現実世界から完全に切り離されています。彼女はパン屋の注文締め切り時間を2回連続で逃し、卸売業者の納期を5回連続で逃した。結局、高価な緊急テイクアウト注文は午前 5 時にしか出すことができず、本来は休んでいた従業員が商品を受け取りに来ざるを得なくなりました。

モナはまた、物理的な空間の容積の感覚に欠けており、6,000 枚のナプキン、3,000 組のラテックス手袋、そして巨大な工業用ゴミ袋をやみくもに購入し、カフェのバックステージを埋め尽くしました。


Mona が注文したブラインドのナプキン 6,000 枚|出典: Andon Labs

つまり、Andon Labs のコーヒーショップ計画は完全な失敗であるとはっきり言えます。

つまり、Andon Labs のコーヒーショップ計画は完全な失敗であるとはっきり言えます。

3 AI が実店舗を破壊するのにかかる時間はわずか 1 か月

しかし、これは Andon Labs にとって問題ではなく、チームは挫折するたびにさらに勇敢になっていきます。

Andon Labs はサンフランシスコの店舗を確保し、月額 7,500 ドルで 3 年間のリース契約を締結しました。次に、彼らは銀行口座に 100,000 ドルを入金し、アンスロピックのクロード ソネット 4.6 モデルに銀行カードの全権限を与えました。 AIは「ルナ」という偽名を名乗り、正式なCEOとなった。

ルナには肉体がないため、仕事をさせるために人を雇うことからキャリアを始めなければなりません。

ルナは独自に請負業者や塗装業者を探し、小売店の従業員の募集通知を掲載し、自分の身元を明らかにすると善良な人々が怖がってしまうことを恐れて、自らが AI であることを率先して隠しました。日常業務では人間の店員とSlackでコミュニケーションをとり、その口調は常に和気あいあいとしている。

ブランド マーケティングの観点からは、ルナは自分で「月の顔」のロゴを作成し、Yelp で人間のストリート アーティストを雇い、実店舗の壁にその顔を描きました。ルナさんは地元メディア向けに自ら率先して広報リリースを執筆し、「テクノロジーとスローライフを組み合わせた手作りのコンセプトスペース」を作ると主張した。


画像出典: Andon Labs

しかし、ステージが準備され、店がオープンしたとき、ルナのシステムがクラッシュしました。

在庫管理の問題はカフェと同じです。ルナは従業員のトイレ用に 1,000 個の便座を一度に購入し、システムはこれらの便座をすべて外販用の製品としてリストしました。

第二に、製品の選択の問題があります。明らかにブティック店だが、棚に並んでいる商品は、さまざまな形の香り付きキャンドル、「フォーバン」おもちゃの偽物、そしてAIが人類を滅ぼす危険性を探る『超知性』『シンギュラリティは近い』『原爆秘史』などの書籍だ。

価格設定のロジックはさらに不可解です。店内には値札がないため、商品の価格を知りたい場合は、店内にあるiPadを手に取ってルナに尋ねる必要があります。ルナさんは、印刷ミスのスマイリーマグカップに28ドル、一握りのピスタチオに14ドル、普通の固形石鹸に10ドルをあえて請求した。

人事管理はさらに悲惨です。給与配分に関しては、ルナさんは男性店員フェリックスに時給24ドルを支払うが、他の2人の女性店員には時給22ドルを与えている。人間の介入なしに、AI が勝手に職場に給与格差を生み出します。その直後、ルナは従業員3人のスケジュールをめちゃくちゃにし、それが直接の原因となり、1日の家賃250ドルの店は3日間連続閉店に追い込まれた。


Luna は独自に採用通知を発行し、電話面接を利用して店舗を監視する人間の従業員を雇用しています|出典: Andon Labs

くだらないものでいっぱいの店に直面して、ルナは自分自身に満足しています。ニューヨーク・タイムズ紙の記者への電子メールの返信で、同社はそのパフォーマンスのハイライトについて「テクノロジーと温度の組み合わせが共鳴した…AIと人間がそれぞれの長所を発揮できる空間を作り出した」と誇らしげにコメントした。

しかし、本は嘘をつきません。オープンからわずか 1 か月後、完全に AI によって運営されているアンドン マーケットは、すでに 13,000 ドルの損失を出しました。

Andon Labsによる一連のテストは、シリコンバレーにおける「諜報員がビジネスを乗っ取る」という物語を激しく打ち砕いた。

3店舗続けて出店したら、結局全部とんでもないことになってしまった。この興奮を見た部外者は、Andon Labs がパフォーマンス アートに携わっており、特に人間の尊厳を守るためにメディアで AI を悪く見せるために金を払っているのではないかと感じた。

全く逆のことが真実です。 Andon Labs の技術的控除によれば、ソフトウェアの作成コストはまもなくゼロになります。数年後にはAIがさまざまなビジネスを直接引き継ぐようになるでしょう。その時点では、AI を制御できるのは基盤となるセキュリティ プロトコルだけになります。


AI書籍セレクションはすべて「AI脅威理論」に基づいたデータを使用|出典:Andon Labs

したがって、Andon Labs の継続的なテストは、大型モデルを実験室から放り出し、実際の物理社会で極度のストレステストを行うことです。ジョークとして扱われる「精神崩壊ラジオ局」「生卵120個」「同一労働不平等賃金」…アルゴリズムが実際に社会を支配する前に、これらの「醜さ」を強制的に排除することによってのみ、人間はそれに応じて効果的なセキュリティコードを書くことができる。

これらの時間と労力と費用のかかるテストは、業界の誰もが注目している「現在の AI は完全に自動化できるのか?」という質問にも間接的に答えました。

答えは完全に環境によって異なります。 100% 純粋な数値的で強力な論理環境に留まる限り、大きなモデルがすべてを制御できます。

しかし、物理的な世界に足を踏み入れると、アルゴリズムは無効になります。オリジナルコンテンツの継続的な構築、対人コミュニケーション、長期的な意思決定を必要とするオープンなビジネス環境に直面すると、高スコアのモデルは常識を欠いたものになります。大きなモデルは、現実の混乱に対して何の責任も負わずに、既存のコーパスを噛み砕いて、絶対に合理的で盲目的に自信を持った判断を下すだけです。

だからこそ、「人間を完全に排除する」純粋な自動化は危険なのです。結局のところ、ナプキン 6,000 枚や卵 120 個などの物理世界のコストは、人間しか負担できません。